Comments / Profile of NewTechAudit / Habr

NTA @NewTechAudit

Профессиональное сообщество

ProfileArticles282PostsNewsComments307

Парсинг сайта с помощью PYTHON + SELENIUM

NewTechAudit Mar 22 2022 at 08:27

Не пробовал.

Look

Парсинг сайта с помощью PYTHON + SELENIUM

NewTechAudit Mar 22 2022 at 08:26

По ip не забанили, думаю им не выгодно, так как я просматриваю рекламу при каждом её появлении. Может позже это пофиксят. Через request вполне могут забанить, но стоит попробовать, спасибо!

Look

Распознавание лиц на RASPBERRY PI

NewTechAudit Mar 2 2022 at 06:24

Проект начинался больше года назад на оборудовании, имеющемся в университете.

Признаюсь, про Maixduino я не знал; про esp32 cam слышал, но не рассматривал его как базу для проекта – распа гораздо удобнее и функциональнее. Насчет «полного аналога» - не думаю, что на esp удастся реализовать работу функционального бота в ТГ параллельно с распознаванием лиц + постоянное обращение к БД. И этого точно там нет «из коробки».

Тестирование на ORL приведено исключительно для сравнения быстродействия. Именно этот набор данных был выбран, поскольку он легкий и был сверху в результатах поискового запроса.

С фактом устаревания Dlib спорить не буду, скажу лишь что его вполне достаточно для решения задач, изначально поставленных перед проектом. Для работы модуля face-recognition, ничего не нужно обучать – он и так находит лица, справляется с их векторным преобразованием и сравнением. Ошибок при внесении векторов лиц в базу – нет, ведь предполагается самостоятельная загрузка фотографий пользователем через бот (можно добавить пометку а-ля «фотография не должна быть смазанной, лицо должно быть отчетливо видно»).

Спасибо, что напомнили про недостатки - они и правда есть. Например, невозможно распознать лицо человека на расстоянии более 5м (разрешение картинки на входе режется для быстрой обработки) и в темноте. Отсутствие возможности переобучения алгоритма распознавания за недостаток не считаю – проект делался не для сложных исследований, а для простых задач.

ЗЫ: большое спасибо за совет с MediaPipe. Потрогаю и внедрю в систему, если будет возможность.

Look

Тематическое моделирование с использованием эмбеддингов BERT

NewTechAudit Mar 1 2022 at 09:22

Добрый день. Сравнение с BERTopic не проводилось. Но кажется, BERTopic показал бы лучший результат за счет более детальной обработки эмбеддингов, полученных из модели.

Look

Руководство по распознаванию эмоций на изображении с использованием Python

NewTechAudit Feb 9 2022 at 10:47

Сквозь натянутую улыбку Гарольда пробивается глубокая скрытая боль.

Look

Прогнозируем реальные вероятности

NewTechAudit Feb 9 2022 at 10:40

Да, абсолютно верно. В первом фрагменте с тестовым набором должно быть n_features = 30. Спасибо, за замечание. Опечатка исправлена.

Look

Прогнозируем реальные вероятности

NewTechAudit Feb 9 2022 at 10:38

Имеется в виду Непараметрический метод гистограммной калибровки. Он кратко описан в данной статье https://dyakonov.org/2020/03/27/проблема-калибровки-уверенности/. В ней также есть ссылка на оригинальное исследование на английском языке

Look

Максимально просто о распознавании речи при помощи NeMo

NewTechAudit Feb 4 2022 at 04:25

Действительно так, модели энкодеры в этом плане могут отлично дополнить asr, спасибо!

Look

Способы представления аудио в ML

NewTechAudit Jan 26 2022 at 09:42

Обычно звуковой сигнал делится на микросэмплы, например по 10-100мс, для каждого семпла рассчитывается MFCC. Полученная последовательность признаков и есть то самое представление буквы А или И. Эти последовательности подаются на вход рекуррентной нейронной сети, и уже сама сеть учится определять какая последовательность соответствует одному звуку, а какая другому

Look

Способы представления аудио в ML

NewTechAudit Jan 26 2022 at 08:52

Эту задачу можно решить как раз используя MFCC. То есть, в качестве векторов признаков будут использоваться мел-кепстральные коэффициенты.

Look

Способы представления аудио в ML

NewTechAudit Jan 26 2022 at 08:51

Спасибо за дополнение! Возможно, в будущем будет написана статья-продолжение с более глубоким рассмотрением формирования MFCC и кастомных эмбеддингов.

Look

Нейродайджест: главное из области машинного обучения за декабрь 2021

NewTechAudit Jan 19 2022 at 03:23

Спасибо за интересный дайджест! очень полезно.

Look

PAC-MAN на основе deep Q network МОДЕЛИ

NewTechAudit Dec 14 2021 at 11:42

Приведена основная часть кода

-2

Look

PAC-MAN на основе deep Q network МОДЕЛИ

NewTechAudit Dec 14 2021 at 11:41

Спасибо за интерес к статье, временно рабочий пример предоставить не можем.

Look

Визуализация данных с помощью веб-фреймворка Dash

NewTechAudit Dec 3 2021 at 10:01

На сколько я знаю dash Enterprise предоставляет компаниям услуги поддержки, хостинг, развертывания и аутентификации в приложениях dash. Но вроде как эти функции существуют за пределами экосистемы. Так dash вроде как выпущен под лицензией MIT и является бесплатным

Look

Встречаем ровер третьего поколения: история создания робота-курьера Яндекса

NewTechAudit Nov 29 2021 at 04:49

Замечательная разработка, встречали парочку. Спасибо за статью.

Look

Исследование в области русского рукописного текста. Реализация и тестирование прототипа

NewTechAudit Nov 25 2021 at 09:55

Тест у вас интересный! Но, как справедливо уже замечено другими, такое даже человек не всегда сможет правильно разобрать, а нейросетевые технологии пока только стремятся к тому, чтобы сравниться с людьми в распознавании объектов на фотографиях. Успехи конечно уже есть, например, на конкурсе ImageNette по классификации изображений алгоритмы глубокого обучения уже превзошли в точности человека, но в области распознавания рукописных текстов машины пока что не настолько продвинулись, чтобы распознать любой текст. Но работы ведутся днями и ночами, и, может быть, в относительно скором времени и самые страшные почерки врачей научим нейросети распознавать лучше людей, чем спасём, возможно, многих))

Look

Исследование в области русского рукописного текста. Реализация и тестирование прототипа

NewTechAudit Nov 25 2021 at 09:53

Вот могу показать несколько примеров отработки алгоритма.

Look

Сегментация изображений со спутника с помощью сверточной нейронной сети

NewTechAudit Nov 23 2021 at 11:36

Да, данный метод применим для сегментации внутренних органов человека. Например в конкурсе на Kaggle “Data Science Bowl 2018” решалась медицинская задача – идентификация клеточных ядер с целью анализа реакции клеток на различные обработки. Исходные данные состоят из картинок сегментированных ядер.

Look

Сегментация изображений со спутника с помощью сверточной нейронной сети

NewTechAudit Nov 23 2021 at 11:24

Edge detection используется с помощью встроенной библиотеки OpenCV, где можно использовать разные методы распознавания границ объектов. Однако U-Net сможет распознать более зашумленные изображения или более мелкие, благодаря своей архитерктуре.

Look

1 2 ...

9 10

12 13 14 15 16