Расул Кочкаров @rkochkarov
Доцент
Информация
- В рейтинге
- 4 730-й
- Откуда
- Москва, Москва и Московская обл., Россия
- Работает в
- Зарегистрирован
- Активность
Специализация
Data Scientist, ML Engineer
Lead
Development management
Project management
Information Technology
Machine learning
Math modeling
Computer vision
Natural language processing
Computer Science
Search engine optimization
Добрый день, камней много и они в степи, в студию не занесешь. Карту - у нас называется алфавитом (все возможные классы) составлена. Сейчас скорее проблема в разметке, пока не собрали достаточно большой объем набора размеченных данных. Но постепенно двигаемся. Работа будет продолжаться, но это трудоемкий процесс не на один год. Там много близких алфавитов - где пересечение символов 70-98%. Нужно составлять каждый отдельно и обучать модель для него. Идем по пути Гугл и Яндекс переводчиков...
Все сделали студенты, с чем их и поздравляем! Ждем новых достижений!
Это задача решается в настоящее время многими компаниями. Но делится на подзадачи, каждый в своем сегменте. Нашей командой в том числе выполняется НИР по заказу индустриального партнера по распознаванию бутылок на конвейере.
Думаю здесь в том числе должна робототехника немного догнать. В целом в перспективе 5 лет будут готовы уже все технологии по умной сортировке мусора.
В данном случае имеется в виду страницы этой рукописи. На каждой странице 90-100 символов. Хотелось бы больше, но это единственный сохранившийся источник. Также модель YOLOv8 проводит дополнительную аугментацию.
В целом обученная модель показывает высокую точность детекции и классификации. Фактически без ошибок распознает. Но с наборами данных надо работать... Планируется на следующем этапе.
Шутка хорошая, но задача уже решена в частном случае. Когда пользователи, например, на смартфонах обучают приложения для перевода их письменного изображения в печатный.
Но это нужно некоторые усердие самого пользователя.
А вот чтобы распознавать все "надписи" любого врача - это да, задачка поинтереснее...
В части Ирк Битик немного проще, можно составить алфавит, хотя бы с некоторой вероятностью можно говорить, что его символы покрывают весь алфавит.
С другими надписями сложнее, учитывая разнообразие наречий - орхонский, енисейский, кубанский и др. Очень много расхождений, так как авторы из разных территорий по своему усмотрению добавляли понятные только им символы, также их вращали по своему неведомому разумению в пространстве. Очень много опечаток. В отличие от современного языка, символы означают не только звуки, но и слова, а иногда и предложения (смыслы). В общем задача очень интересная.
В данной работе сделан первый шаг, чтобы понять как дальше двигаться (в части компьютерного зрения - распознавания).
Уже получены первые результаты по статистическому анализу, но пока не проинтерпретированы. Будет в дальнейших публикациях.