Как стать автором
Обновить
555.06

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Сегментация данных с видеокамеры

Время на прочтение4 мин
Количество просмотров5.1K

В современном мире задача сегментации как оказалось решается на раз-два, хотя я думал что это что-то сложное и удивительное. Все что нужно, это прочитать пару статей, установить определенные библиотеки и разметить данные, на все про все нужно пару часов времени, кроме создания тестовой выборки.

Подробнее
Всего голосов 10: ↑8 и ↓2+6
Комментарии38

Я спросил GPT-3 о «вопросе 42». Ответ мне не понравился. И вам тоже не понравится

Время на прочтение5 мин
Количество просмотров33K
Известно, что ответ на вопрос жизни, Вселенной и всего такого — 42. Однако, несмотря на согласованные усилия лучших умов человечества, соответствующий вопрос всё ещё ускользает от нас. Специально к старту нового потока курса «Машинное обучение» делимся материалом, автор которого задаёт тот самый вопрос  новейшей языковой модели GPT-3. Что из этого вышло — читайте под катом.


Приятного чтения!
Всего голосов 55: ↑38 и ↓17+21
Комментарии48

Тестируем комплементарную кросс-энтропию в задачах классификации текста

Время на прочтение5 мин
Количество просмотров3.3K
Ранее в этом году И. Ким совместно с соавторами опубликовали статью [1], в которой предложили новую функцию потерь для задач классификации. По оценке авторов, с её помощью можно улучшить качество моделей как в сбалансированных, так и в несбалансированных задачах классификации в сочетании со стандартной кросс-энтропией.

Классификация бывает необходима, например, при создании рекомендательных систем, поэтому описанный метод интересен как с академической точки зрения, так и в контексте решения бизнес-задач.

В нашей статье мы проверим, как комплементарная кросс-энтропия влияет на задачу классификации текста на несбалансированном наборе данных. Наша цель заключается не в проведении широкого экспериментального исследования или создании решения, готового к применению, а в оценке его перспектив. Просим обратить внимание, что код, описанный в статье, может не подходить для применения на проекте и требовать определенной доработки.

Читать дальше →
Всего голосов 5: ↑4 и ↓1+3
Комментарии0

Как используют Machine Learning и Computer Vision на обогатительных фабриках

Время на прочтение7 мин
Количество просмотров7.2K
Привет, Хабр! Сегодня я продолжу рассказывать о применении Machine Learning и Computer Vision на предприятиях горнодобывающей промышленности нашей страны. На этот раз своё внимание мы обратим на обогатительные фабрики.


Рабочее место диспетчера фабрики

Обогатительная фабрика — это горное предприятие для первичной переработки твёрдых полезных ископаемых с целью получения технически ценных продуктов, пригодных для промышленного использования.

Разнообразие происходящих на фабриках технологических процессов, таких как дробление, измельчение, грохочение, классификация, флотация, цианирование, сорбция, обезвреживание, десорбция, электролиз и многие другие, оставляет широкое поле не только для стандартной автоматизации, но и для применения технического зрения и машинного обучения. Под катом — подробное описание и много больших и красивых фото.
Приятного чтения!
Всего голосов 19: ↑19 и ↓0+19
Комментарии4

Истории

Определяем пол и возраст по фото

Время на прочтение2 мин
Количество просмотров6.8K


В практике внутреннего аудита встречаются задачи, при которых необходимо осуществить проверку по выявлению некорректного ввода данных о клиенте. Одной из таких проблем может быть несоответствие введенных данных и фото клиента, в момент оформления продукта.

К примеру, имеется следующая информация: пол, возраст и ссылка на фото. Для проверки соответствия воспользуемся библиотекой py-agender языка Python.

Работа библиотеки осуществляется в два этапа. На первом, opencv определяет расположение лица на фото. На втором, нейронная сеть архитектуры EfficientNetB3, которая обучена на наборе данных UTKFace DataSet, определяет пол и возраст обладателя лица на фото.

Читать дальше →
Всего голосов 10: ↑8 и ↓2+6
Комментарии2

Управление многозвенными манипуляторами робототехнического комплекса с помощью нейронной сети

Время на прочтение6 мин
Количество просмотров9K

Введение. При моделировании систем управления движением роботов требуется решать задачи кинематики и динамики для их исполнительных механизмов. Существует обратная и прямая задача кинематики. Прямая задача кинематики состоит в определении пространственного положения и ориентации характерной точки, как правило, рабочего инструмента манипулятора робота по известным значениям обобщенных координат. Обратная задача кинематики, как и прямая задача, является одной из основных задач кинематического анализа и синтеза. Для управления положением звеньев и ориентацией рабочего инструмента манипулятора возникает необходимость решения обратной задачи кинематики.

Большинство аналитических подходов для решения обратной задачи кинематики являются достаточно затратными с точки зрения вычислительных процедур. Одним из альтернативных подходов является использование нейронных сетей. Входные данные.

Рассмотрим трехзвенный манипулятор с параметрами, приведенными в таблице 1.

Читать далее
Всего голосов 10: ↑10 и ↓0+10
Комментарии3

Ваш pet-project будет доволен. Как вдохнуть жизнь в свои наработки

Время на прочтение4 мин
Количество просмотров9.6K

Pet project


Всем привет! Как и многие, я люблю поковыряться с каким-либо хобби-проектом, — и удовольствие получаешь и показать при случае можно, а если он способен ещё и пользу кому-то принести, то это вдвойне приятно.


В этой статье я хочу поделиться, как наработки, оставшиеся после соревнования на машинный перевод, вылились в интересный проект и как сотрудничество с Национальным корпусом русского языка вдохнуло в него новую жизнь.

Всего голосов 27: ↑27 и ↓0+27
Комментарии1
Перерисовать человека в кота и наоборот, перевести надпись с китайского «на лету» и сделать подборку статей — эти и многие другие сценарии в мобильных приложениях стали возможны благодаря сервисам, использующим технологии искусственного интеллекта и решающим когнитивные задачи. В мобильной экосистеме Huawei они реализуются через сервис ML Kit, который дает доступ к готовым функциям для мобильных приложений: переводу текста в речь и наоборот, распознаванию лиц и движений и многим другим. Под катом мы расскажем, какие AI-решения предоставляет платформа HMS и как на ней можно работать со своими моделями.
Читать дальше
Всего голосов 26: ↑22 и ↓4+18
Комментарии14

Анонс вебинара по зонтичной системе мониторинга Broadcom DX Operations Intelligence

Время на прочтение1 мин
Количество просмотров931
image

Запись вебинара

Приглашаем вас в эту пятницу (27 ноября) принять участие в вебинаре, на котором представители Broadcom в России презентуют новую зонтичную систему мониторинга Digital Operational Intelligence (DX OI). Во время сессии мы поговорим об основных функциях системы и рассмотрим основные разделы пользовательского интерфейса. Мы покажем как, опираясь на функциональные возможности DX OI, вы сможете обеспечить значительную операционную эффективность IT-подразделений, что позволит им принимать более быстрые и правильные решения для повышения качества ИТ-услуг и бизнес-сервисов за счет междоменного контекстного анализа.
Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии0

HyperBand и BOHB. Понимание современных алгоритмов оптимизации гиперпараметров

Время на прочтение7 мин
Количество просмотров7.8K
Специально к старту курса «Машинное обучение» в этом материале представляем сравнение BOHB и HyperBand — двух передовых алгоритмов оптимизации гиперпараметров нейронной сети и простого случайного поиска оптимальных гиперпараметров. Сравнение выполняется с помощью платформы neptune.ai — инструмента для управления экспериментами в области ИИ. Рисунки, графики, таблицы результатов сравнения — всё это вы найдете под катом.


Приятного чтения!
Всего голосов 15: ↑15 и ↓0+15
Комментарии0

Как стартап находит ground truth данные в сельском хозяйстве

Время на прочтение4 мин
Количество просмотров3.1K

Компания OneSoil разрабатывает бесплатные приложения для фермеров, которыми пользуются более чем в 180 странах мира. В своей работе мы используем большие данные и машинное обучение, и отдельный квест для нас — найти ground truth данные. Рассказываем, как мы решаем эту нетривиальную задачу.

Читать далее
Всего голосов 9: ↑8 и ↓1+7
Комментарии11

Заметки Датасатаниста: что делать, если перед вами оказалась NP-полная задача

Время на прочтение5 мин
Количество просмотров12K


Наверное, каждый сталкивался с тем, что приходилось столкнуться с какой-то сложной задачей, решение к которой не удавалось подобрать не то что сразу — а даже после долгих упорных часов работы или дней. Об одном из классов таких задач — NP-полных, мы сегодня и поговорим.

А вообще реально ли встретить такие задачи в обычной жизни? На самом деле, они возникают в огромном ряде случаев: комбинаторика, графы и сети, выполнение логических формул, работа с картами, оптимальные загрузки, отображения, задачи дискретной оптимизации, нахождение самых длинных последовательностей, поиск равных сумм и многие задачи на множества! И это далеко не полный список.

Под катом неформальный гайд — как понять, что перед вам может быть NP задача и что делать, если это именно она и оказалась. Сегодня мы атакуем этот вопрос с практической стороны.
Читать дальше →
Всего голосов 33: ↑33 и ↓0+33
Комментарии8

Трансформеры в Поиске: как Яндекс применил тяжёлые нейросети для поиска по смыслу

Время на прочтение16 мин
Количество просмотров59K

Привет, Хабр. Меня зовут Саша Готманов, я руковожу группой нейросетевых технологий в поиске Яндекса. Сегодня на YaC 2020 мы впервые рассказали о внедрении трансформера — новой нейросетевой архитектуры для ранжирования веб-страниц. Это наиболее значимое событие в нашем поиске за последние 10 лет. 

Сегодня я расскажу читателям Хабра, в чём заключается иллюзия «поиска по смыслу», какой путь прошли алгоритмы и нейросети в ранжировании и какие основные сложности стоят перед теми, кто хочет применить для этой задачи трансформеры и даже заставить их работать в рантайме. 

Читать далее
Всего голосов 75: ↑73 и ↓2+71
Комментарии65

Ближайшие события

От хорошей работы не только волки дохнут, но и движки распознавания возникают

Время на прочтение6 мин
Количество просмотров2.2K


Сегодня мы, Smart Engines, расскажем историю, как работали в пандемию и что у нас из этого получилось. Расскажем, когда и для кого размер приложения имеет значение, что такое живость документов и куда катится этот дивный мир распознавания.
Читать дальше →
Всего голосов 11: ↑9 и ↓2+7
Комментарии2

AI Journey — путешествие в мир AI

Время на прочтение2 мин
Количество просмотров1.9K


Конец года оказался богат на интересные и зрелищные мероприятия, пусть и проводящиеся в он-лайн формате. Intel принимает в них активное участие, ну а мы активно о них рассказываем и из самых лучших намерений рекламируем. Ведь новые знания и свежие впечатления — это лучшее лекарство от ковидной хандры.

На этот раз мы приглашаем вас на AI Journey – трехдневную он-лайн конференцию по искусственному интеллекту и анализу данных, проводимую ведущими российскими и международными компаниями 3-5 декабря. Intel является титульным партнером конференции, а эксперты компании выступят на ее виртуальной трибуне.
Читать дальше →
Всего голосов 7: ↑6 и ↓1+5
Комментарии0

Как посмотреть плоские фильмы в 3D

Время на прочтение7 мин
Количество просмотров7.9K

Это сильно расширенная версия моей публикации на Medium

Недавно я сидел в баре с другом зашел разговор о том, в каких задачах в принципе может быть эффективен нейросетевой подход, а где они совершенно излишни. Один класс примеров, где нейросети часто наголову превосходят классические алгоритмы - обработка изображений. Точность решения задачи распознования объектов на изображении может даже превосходить человеческое восприятие. Кроме того, интересны и задачи переноса стиля, генерации реалистичных изображений, superresolution итд. Нейросети могут быть очень эффективны также в задачах типа pixtopix, когда происходит генерация одного изображения из другого. Тогда у меня и возникла идея попробовать применить данные алгоритмы для преобразования 2d фильмов в 3d.

Читать далее
Всего голосов 18: ↑18 и ↓0+18
Комментарии20

Как отличить реальное лицо от ложного при распознавании лиц

Время на прочтение4 мин
Количество просмотров3.5K
image

Краткое описание


Отличие реального лица человека от ложного в камере все еще остается одним из сложных проблем в системах контроля и доступа в помещения. Предлагается алгоритм для обнаружения моргания глаз в реальном времени в видеопоследовательности от стандартной камеры, что дает нам факт что человек в камере является реальным. Последние детекторы наземных ориентиров, обученные на наборах данных в полевых условиях, демонстрируют превосходную устойчивость к ориентации головы относительно камеры, изменяющейся освещенности и выражений лица. Мы показываем, что ориентиры обнаруживаются достаточно точно, чтобы надежно оценить уровень открытия глаза. Таким образом, предложенный алгоритм оценивает положения ориентиров, извлекает одну скалярную величину — коэффициент глазного дна (EAR) — характеризующую открытие глаза в каждом кадре. Наконец, классификатор SVM обнаруживает мигание глаз как образец значений EAR в коротком временном окне. Простой алгоритм превосходит современные результаты по двум стандартным наборам данных.
Читать дальше →
Всего голосов 12: ↑10 и ↓2+8
Комментарии8

Пишем голосового ассистента на Python

Время на прочтение16 мин
Количество просмотров155K

Введение


Технологии в области машинного обучения за последний год развиваются с потрясающей скоростью. Всё больше компаний делятся своими наработками, тем самым открывая новые возможности для создания умных цифровых помощников.

В рамках данной статьи я хочу поделиться своим опытом реализации голосового ассистента и предложить вам несколько идей для того, чтобы сделать его ещё умнее и полезнее.

image
Читать дальше →
Всего голосов 14: ↑13 и ↓1+12
Комментарии5

Как можно сэкономить на онлайн-курсах и сделать обучение эффективнее

Время на прочтение2 мин
Количество просмотров6K

Хотела бы поделиться лайфхаком, который позволит кому-то сэкономить на онлайн-курсах, особенно новичкам в профессии, отдающих по 100тыщ за годовые курсы, а кому-то сделать свое обучение сильно эффективнее.

Читать далее
Всего голосов 16: ↑9 и ↓7+2
Комментарии5

Кластеризация и классификация больших Текстовых данных с помощью машинного обучения на Java. Статья #2 — Алгоритмы

Время на прочтение18 мин
Количество просмотров6.5K
image

Привет, Хабр! Сегодня будет продолжение темы Кластеризация и классификация больших Текстовых данных с помощью машинного обучения на Java. Данная статья является продолжением первой статьи.



Статья будет содержать Теорию, и реализацию алгоритмов который я применял.


Читать дальше →
Всего голосов 4: ↑4 и ↓0+4
Комментарии2

Вклад авторов

Работа

Data Scientist
60 вакансий