Комментарии / Профиль rkochkarov / Хабр

Расул Кочкаров @rkochkarov

Доцент

Распознавание орхоно-енисейских рунических надписей методами машинного обучения

Добрый день, камней много и они в степи, в студию не занесешь. Карту - у нас называется алфавитом (все возможные классы) составлена. Сейчас скорее проблема в разметке, пока не собрали достаточно большой объем набора размеченных данных. Но постепенно двигаемся. Работа будет продолжаться, но это трудоемкий процесс не на один год. Там много близких алфавитов - где пересечение символов 70-98%. Нужно составлять каждый отдельно и обучать модель для него. Идем по пути Гугл и Яндекс переводчиков...

Посмотреть

Профайлинг уровня эксперт или голодные игры по HR’овски

rkochkarov 24 мар в 15:31

Все сделали студенты, с чем их и поздравляем! Ждем новых достижений!

Посмотреть

Распознавание тюркских рунических надписей на примере Ирк Битиг

rkochkarov 11 июл 2024 в 12:57

Это задача решается в настоящее время многими компаниями. Но делится на подзадачи, каждый в своем сегменте. Нашей командой в том числе выполняется НИР по заказу индустриального партнера по распознаванию бутылок на конвейере.
Думаю здесь в том числе должна робототехника немного догнать. В целом в перспективе 5 лет будут готовы уже все технологии по умной сортировке мусора.

Посмотреть

Распознавание тюркских рунических надписей на примере Ирк Битиг

rkochkarov 17 июн 2024 в 15:24

В данном случае имеется в виду страницы этой рукописи. На каждой странице 90-100 символов. Хотелось бы больше, но это единственный сохранившийся источник. Также модель YOLOv8 проводит дополнительную аугментацию.
В целом обученная модель показывает высокую точность детекции и классификации. Фактически без ошибок распознает. Но с наборами данных надо работать... Планируется на следующем этапе.

Посмотреть

Распознавание тюркских рунических надписей на примере Ирк Битиг

rkochkarov 28 мая 2024 в 10:59

Шутка хорошая, но задача уже решена в частном случае. Когда пользователи, например, на смартфонах обучают приложения для перевода их письменного изображения в печатный.
Но это нужно некоторые усердие самого пользователя.
А вот чтобы распознавать все "надписи" любого врача - это да, задачка поинтереснее...

Посмотреть

Распознавание тюркских рунических надписей на примере Ирк Битиг

rkochkarov 28 мая 2024 в 10:54

В части Ирк Битик немного проще, можно составить алфавит, хотя бы с некоторой вероятностью можно говорить, что его символы покрывают весь алфавит.

С другими надписями сложнее, учитывая разнообразие наречий - орхонский, енисейский, кубанский и др. Очень много расхождений, так как авторы из разных территорий по своему усмотрению добавляли понятные только им символы, также их вращали по своему неведомому разумению в пространстве. Очень много опечаток. В отличие от современного языка, символы означают не только звуки, но и слова, а иногда и предложения (смыслы). В общем задача очень интересная.

В данной работе сделан первый шаг, чтобы понять как дальше двигаться (в части компьютерного зрения - распознавания).

Уже получены первые результаты по статистическому анализу, но пока не проинтерпретированы. Будет в дальнейших публикациях.

Посмотреть

В рейтинге: 5 072-й

Откуда: Москва, Москва и Московская обл., Россия

Работает в: Финуниверситет

Зарегистрирован: 25 января 2024

Активность: 30 мая в 18:07

Data Scientist, ML Engineer

Lead

Development management

Project management

Information Technology

Machine learning

Math modeling

Computer vision

Natural language processing

Computer Science

Search engine optimization

Информация

Специализация