Articles / Profile of DELTA37 / Habr

Георгий Каспарьянц@DELTA37

ИИ Гений

Subscribers

ProfileArticles6PostsNewsComments3

DELTA37 Aug 12 2022 at 15:22

Изучение нейросетевого подхода к решению OCR на примере задачи распознавания арабского текста

6 min

13K

Data Mining * Machine learning * Data Engineering *

Оптическое распознавание символов (Optical Character Recognition) — одна из первых задач компьютерного зрения, заключается в переводе изображений рукописного или печатного текста в текстовые данные, использующиеся в компьютере.

Поэтому в этой статье мы будем изучать и тестировать подходы, основанные именно на этой технологии. Далее мы рассмотрим различные подходы к решению задач OCR и сравним их, а также попробуем разобраться, как подобрать подходящий инструмент для конкретной проблемы. Для эксперимента мы выбрали нестандартную задачу - распознавание арабского текста.

DELTA37 Jul 15 2022 at 12:25

Обучение алгоритма генерации текста на основе высказываний философов и писателей

7 min

6.5K

Machine learning * Data Engineering *

Tutorial

Наверняка вы мечтали поговорить с великим философом: задать ему вопрос о своей жизни, узнать его мнение или просто поболтать. В наше время это возможно за счет чат-ботов, которые поддерживают диалог, имитируя манеру общения живого человека. Подобные чат-боты создаются благодаря технологиям обработки естественного языка и генерации текста. Уже сейчас существуют обученные модели, которые неплохо справляются с данной задачей.

В этой статье я расскажу о своем опыте обучения алгоритма генерации текста, основанного на высказываниях великих личностей. В датасете для обучения модели используются цитаты десяти известных философов, писателей и ученых.

DELTA37 Jun 9 2022 at 09:44

Как быстро создать обучающий датасет для задач обнаружения объектов YOLO с помощью Label Studio

4 min

29K

Big Data * Data Engineering * Data Mining * Machine learning *

Tutorial

Обнаружение объектов — одна из подзадач компьютерного зрения для идентификации определенных объектов. Например, люди, здания, растений, дорожных знаков или транспортные средства на изображениях и видео.

Для создания таких моделей существует множество различных типов алгоритмов, таких, как Scale-invariant feature transform (SIFT), Detectron, RefineDet или You Only Look Once (YOLO). Их часто используют в самых разных отраслях, начиная с автономного вождения и охранных систем, заканчивая автоматизацией на производстве и распознаванием лиц.

Как и с любой моделью машинного обучения, всё начинается с создания обучающего набора данных. Сделать это можно разными способами: можно заказать разметку данных, а можно всё сделать самому.

Конечно, второй вариант займет намного больше времени и сил, но с помощью правильно подобранного ПО можно неплохо упростить задачу. Сейчас я подробно расскажут, как быстро создать обучающий датасет для задач детекции объектов YOLO с помощью Label Studio.

Посмотрим, что у тебя там...

DELTA37 May 25 2022 at 15:55

Объединение данных с датчиков и интерполяция для Autonomous Vehicles

5 min

Data Engineering * Big Data * Data Mining *

Translation

Товарищи, рассказываю о нюансах сбора и работы с данными для Autonomous Vehicles. Как правило, для создания обучающего датасета используют данные с датчиков LIDAR и камер. Но полученные данные в сыром виде очень разрознены ,и чтобы решить эту проблему, их нужно правильно объединить и интерполировать. И только после этого приступать к 3D Point Cloud разметке.

DELTA37 Apr 8 2022 at 08:34

Разметка именованных сущностей в Label Studio

5 min

38K

Machine learning * Data Mining * Big Data *

Tutorial

В предыдущей статье мы уже подробно рассмотрели процесс разметки семантической сегментации в CVAT. Сейчас я подробнее расскажу по NER-разметку в другом популярном open source инструменте Label Studio

Предупреждаю, статья в первую очередь направлена на новичков, которые делают первые шаги в разметке данных. Как и в прошлый раз мы шаг за шагом пройдем путь от установки и настройки проекта до экспорта уже размеченного датасета.

В процессе будем подробнее останавливаться на нюансах связанных с извлечением именованных сущностей и рекомендациях из личного опыта.

Посмотрим, что у тебя там...

DELTA37 Apr 5 2022 at 16:09

Семантическая сегментация изображений в CVAT

5 min

7.8K

Big Data * Data Engineering *

Tutorial

Товарищи, я начинаю цикл статей-туториалов по разметке данных с помощью разного ПО. Начать решил с самого знаменитого из всех бесплатных инструментов - Computer Vision Annotation Tool. Им может воспользоваться буквально любой желающий, достаточно только зарегистрироваться.

Предупреждаю: это вводная статья для новичков, призванная решить самые главные вопросы "как это работает и куда тыкать". Экспертов прошу поправить или дополнить написанное.

На русском языке не встречал настолько подробных гайдов. Думаю он будет очень полезен.

Ну посмотрим, что там у тебя...

-2

Изучение нейросетевого подхода к решению OCR на примере задачи распознавания арабского текста

Обучение алгоритма генерации текста на основе высказываний философов и писателей

Как быстро создать обучающий датасет для задач обнаружения объектов YOLO с помощью Label Studio

Объединение данных с датчиков и интерполяция для Autonomous Vehicles

Разметка именованных сущностей в Label Studio

Семантическая сегментация изображений в CVAT

Information

Specialization