Как стать автором
Обновить
9
0
Rustem Kamalov @uranusq

Cybersecurity software engineer

Отправить сообщение

Генерация паспортных данных для обучения моделей

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров12K

Привет, Хабр!

Меня зовут Максим Кравец, я участник профессионального сообщества NTA.

Для тренировки нейронных сетей необходимы датасеты с достаточным количеством тренировочных данных. Зачастую в рамках разработки ML‑модели, именно составление датасета, пригодного для её обучения, занимает большую часть времени и усилий. В случае, если датасет нельзя составить из реальных данных, прибегают к генерации синтетических данных. При разработке «распознавателя» паспортов без достаточного количества реальных образцов возникла необходимость генерации паспортных данных и соответствующих им изображений отдельных полей.

Приступить к генерации!
Всего голосов 5: ↑5 и ↓0+5
Комментарии1

Лучший regexp для Go. Benchmark c другими ЯП. Сравнение библиотек

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров4K

"Не используйте регулярки - иначе вместо 1 проблемы, у вас их станет 2!" - как то так говорят знатоки... А что остается делать непослушным, желающим эффективный поиск по большому количеству шаблонов?

Да, для такой довольно специфичной проблемы существуют крутые решения вроде Ragel или re2c. Тем не менее, для своего проекта мне показалось нецелесообразным пока осваивать эти прекрасные технологии.

В этой статье мы рассмотрим альтернативы стандартной библиотеке для регулярных выражений в Go, проведем их бенчмарк по скорости и потребляемой памяти. А также с практической точки зрения рассмотрим различия между ними.

Читать далее
Всего голосов 11: ↑10 и ↓1+12
Комментарии8

Googlим бесплатно (и Яндексим): open-source решение с API

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.6K

Бесплатно? Конечно же никто у вас деньги за "пойти в гугл" не возьмет... А что если попытаться автоматизировать сей процесс? Вот тут то возникают проблемы и чернозём для бизнесов.

Как и в прошлой статье я полез доставать файлы из интернетов, на этот раз из Гуглов. История повторилась и я осознал, что где-то в закромах у меня был код для этого. С радостью начав его изучать, понял, что радости там не много и легче найти что-то готовое...

Далее мы мельком посмотрим: какие решения на текущий момент нам может предложить рыночек, что и с какими дефектами отдают даром. Также изучим какие проблемы возникают при автоматизации сего процесса и как в конечном итоге это можно сделать легко и бесплатно!

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Я два года выпускаю крошечные проекты

Время на прочтение6 мин
Количество просмотров42K

Два года назад, утомлённый длинным списком нереализованных идей проектов в телефоне, я решил попробовать осуществлять по идее за неделю в их минимальном виде.

Мне так и не удалось придерживаться еженедельного графика, однако я продолжал неторопливо работать, пока не выпустил восемь проектов.

Каждое утро я сидел с кофе и набрасывал код какого-то проекта. Это моё любимое хобби, а теперь оно стало приносить приличный пассивный доход.

В этом посте мне хочется рассказать о запущенных проектах и поделиться тем, чему научился в процессе создания этих крошечных Интернет-проектов.
Читать дальше →
Всего голосов 111: ↑111 и ↓0+111
Комментарии102

Всё, что вы НЕ хотели бы знать о сервисах онлайн знакомств… [много букОв и иллюстраций + регулярно дополняется]

Уровень сложностиПростой
Время на прочтение60 мин
Количество просмотров303K
Компьютерные сети изменили мир и подарили нам возможность не выбирать «меньшее из зол» из ограниченного числа сложившихся по жизни контактов, а найти по-настоящему любимого человека, даже если он прячется от нас на другом материке. Разумеется, мы можем отказаться от этой возможности и пойти по воспетому российской эстрадой садистско-мазохистскому сценарию «слепила из того, что было, а потом, что было, то и полюбила». И все будут только рады, если у нас всё получится. Но, если мы подведем статистику известных нам счастливых пар, сложившихся по этому сценарию, и трезво оценим вероятность успешного исхода, то, вероятно, путь поиска своего счастья в мировой паутине покажется нам более перспективным. И в этой статье я хочу рассказать вам о тех проблемах с которыми на этом пути можно столкнуться.
Читать дальше →
Всего голосов 232: ↑221 и ↓11+271
Комментарии775

О трудном и утомительном пути от идеи до веб-сайта

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.2K

2017 год. Я уже около шести лет работаю в компании, продающей кубики Рубика, и начинаю испытывать зуд от желания попробовать что-то новое. Несколько лет проработав с физическими товарами, я осознал, что всегда хотел работать в полностью онлайновом и виртуальном бизнесе, в котором не придётся иметь дело с материальными продуктами (и не испытывать связанной с ними головной боли).
Читать дальше →
Всего голосов 29: ↑26 и ↓3+34
Комментарии2

Пишем на Go как в Google. Лучшие практики — часть первая

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров23K

Рекомендации по стилю для проектов Google с открытым исходным кодом


Лучшие практики Go


Этот документ — часть документации по стилю Go в Google. Он не является ни нормативным, ни каноничным, это дополнение к «Руководству по стилю». Подробности смотрите в Обзоре.


О документе


Здесь приведены рекомендации по лучшим практикам применения требований «Руководства по стилю» для Go. Это руководство охватывает общие и распространенные случаи, но не может применяться к каждому частному случаю. Обсуждение альтернатив, по возможности, включено в текст руководства вместе с указаниями о том, когда они применимы, а когда — нет.


Полная документация руководства по стилю описывается в обзоре.

Читать дальше →
Всего голосов 8: ↑4 и ↓4+3
Комментарии8

Где стартапу найти деньги? Список всех финансовых инструментов в России

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров7.4K

Цель моей статьи сегодня - показать какие инструменты финансовой поддержи стартап может найти в России и мое субъективное мнение о каждом источнике. В статье не раскрою секретов, но соберу все источники в одном месте.

Читать далее
Всего голосов 7: ↑5 и ↓2+3
Комментарии0

Как запускать 50+ пилотов в год и не сойти с ума

Время на прочтение5 мин
Количество просмотров2K

Привет, друзья! Я Екатерина Соловьева, дирижёр пилотов в Альфе. В прошлой статье я поделилась чек-листом для стартапов, которые хотят работать с корпорациями. В этот раз расскажу, что учесть компаниям-заказчикам. В статье мы вместе разберём два проекта, и у вас сложится картинка — что инноватору учесть при запуске пилотов.

Итак, представьте, что компания поручила вам найти вендора, протестировать решение и масштабировать. Составим чек-лист, чтобы вы точно вышли в прод и не застряли в проекте на долгие месяцы.

Читать далее
Всего голосов 21: ↑19 и ↓2+17
Комментарии0

«Самый объективный рейтинг рынка российских SaaS за 2022 год»

Время на прочтение2 мин
Количество просмотров4.7K

Кто больше всех выиграл от импортозамещения, а кого обошли на повороте конкуренты, какие новички стали зарабатывать на подписках больше 100 млн рублей в год? Ответы на эти вопросы вы найдете внутри статьи.

Читать далее
Всего голосов 8: ↑5 и ↓3+3
Комментарии0

Как мыслит бизнес-ангел и как найти инвестора ​для своего стартапа

Время на прочтение8 мин
Количество просмотров3.9K

Бизнес-ангелы обычно живут в тени стартапов, мало светятся в публичном пространстве и редко делятся своей внутрянкой. Сегодня вы узнаете, как реальный ангел оценивает проекты, почему считает основателей-технарей более перспективными партнерами и почему выбирает рынки развивающихся стран для инвестиций.

Читать далее
Всего голосов 8: ↑5 и ↓3+2
Комментарии0

Посторонним вход воспрещен: как устроены закрытые клубы бизнес-ангелов и как стартапу в них проникнуть

Время на прочтение7 мин
Количество просмотров3.1K

Основатель стартапа мечтает, чтобы ему дали денег на новый проект и ищет любые возможности для получения инвестиций. И ведь есть организации, которые вроде бы в этом могут помочь, только вот туда не попасть «с улицы», даже если у вас отличный проект.

Читать далее
Всего голосов 6: ↑4 и ↓2+2
Комментарии2

Получаем сертификат ЦРУ перебирая архивы

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров5.2K

Когда-то давно передо мной стояла задача по поиску файлов на ресурсах, которые могли уже не работать или определённые данные с них были удалены. Тогда для этой цели я использовал веб архивы Common Crawl и самопальный инструмент для автоматизации взаимодействия с ним.

Сейчас мне понадобилось решить схожую задачу, но Common Crawl упал и пока не встаёт… Поэтому было принято решение допилить свой инструмент до уровня скоростного велосипеда с использованием Wayback Machine и поделиться небольшим опытом извлечения архивных данных.

Не погружаясь сильно в детали, далее, в общих чертах я опишу что используют сервисы для архивации, как мы можем этим пользоваться через API, а в конце мы сертифицируемся по-ЦРУшному используя инструмент GoGetCrawl.

Хочу сертификат
Всего голосов 7: ↑6 и ↓1+9
Комментарии5

Информация

В рейтинге
Не участвует
Откуда
Казань, Татарстан, Россия
Зарегистрирован
Активность

Специализация

Security Engineer, Research & Development
Senior
От 450 000 ₽
Python
Golang
Linux
English
Software development