Как стать автором
Обновить
1
0
Расул Кочкаров @rkochkarov

Доцент

Отправить сообщение

Добрый день, камней много и они в степи, в студию не занесешь. Карту - у нас называется алфавитом (все возможные классы) составлена. Сейчас скорее проблема в разметке, пока не собрали достаточно большой объем набора размеченных данных. Но постепенно двигаемся. Работа будет продолжаться, но это трудоемкий процесс не на один год. Там много близких алфавитов - где пересечение символов 70-98%. Нужно составлять каждый отдельно и обучать модель для него. Идем по пути Гугл и Яндекс переводчиков...

Все сделали студенты, с чем их и поздравляем! Ждем новых достижений!

Это задача решается в настоящее время многими компаниями. Но делится на подзадачи, каждый в своем сегменте. Нашей командой в том числе выполняется НИР по заказу индустриального партнера по распознаванию бутылок на конвейере.
Думаю здесь в том числе должна робототехника немного догнать. В целом в перспективе 5 лет будут готовы уже все технологии по умной сортировке мусора.

В данном случае имеется в виду страницы этой рукописи. На каждой странице 90-100 символов. Хотелось бы больше, но это единственный сохранившийся источник. Также модель YOLOv8 проводит дополнительную аугментацию.
В целом обученная модель показывает высокую точность детекции и классификации. Фактически без ошибок распознает. Но с наборами данных надо работать... Планируется на следующем этапе.

Шутка хорошая, но задача уже решена в частном случае. Когда пользователи, например, на смартфонах обучают приложения для перевода их письменного изображения в печатный.
Но это нужно некоторые усердие самого пользователя.
А вот чтобы распознавать все "надписи" любого врача - это да, задачка поинтереснее...

В части Ирк Битик немного проще, можно составить алфавит, хотя бы с некоторой вероятностью можно говорить, что его символы покрывают весь алфавит.

С другими надписями сложнее, учитывая разнообразие наречий - орхонский, енисейский, кубанский и др. Очень много расхождений, так как авторы из разных территорий по своему усмотрению добавляли понятные только им символы, также их вращали по своему неведомому разумению в пространстве. Очень много опечаток. В отличие от современного языка, символы означают не только звуки, но и слова, а иногда и предложения (смыслы). В общем задача очень интересная.

В данной работе сделан первый шаг, чтобы понять как дальше двигаться (в части компьютерного зрения - распознавания).

Уже получены первые результаты по статистическому анализу, но пока не проинтерпретированы. Будет в дальнейших публикациях.

Информация

В рейтинге
4 730-й
Откуда
Москва, Москва и Московская обл., Россия
Работает в
Зарегистрирован
Активность

Специализация

Data Scientist, ML Engineer
Lead
Development management
Project management
Information Technology
Machine learning
Math modeling
Computer vision
Natural language processing
Computer Science
Search engine optimization