elephant Apr 22 2014 at 13:30

Индексация рукописного текста в изображениях: от европейских языков к азиатским

4 min

6.9K

Evernote corporate blogSearch engines*

+19

Comments 8

inscriptor Apr 22 2014 at 16:29

Интересно, а, например, бенгали сможет распознать?

Roberto Apr 22 2014 at 16:47

Нет пока:

Envek Apr 22 2014 at 17:12

Эх, мне бы связку 日本語 + Русский + English…

vaily Apr 22 2014 at 20:30

Эм, сразу возникает два вопроса:
1) Зачем городить огород со своей системой распознания. По поиску 文字识别 в 百度 уже есть несколько сотен проектов, как бесплатных, так и платных. Неужели есть такие сложности с получением лицензии на их использование, или это требование такое — иметь свой движок?
2) Сравнение корейского и китайского исключительно некорректное. Корейский пример — обычный рукописный текст, а китайский, такое ощущение, писал ребенок лет пяти( или студент первого месяца языковых курсов). Интересно было бы посмотреть, как ваш распознаватель справится с обычным текстом взрослого человека( айпад справляется на ура). Например( в следующем комментарии):

Iskin Apr 22 2014 at 22:50

Речь не о вводе отдельного символа, а о разборе целой фразы. Алгоритм айОСа не справится с разбором целой фразы, так как там требуется куча логики и архитектурных решений для определения границ символов слов (собственно статья об этом).

Поэтому и готовые движки «распознавания символов» не подходят, так как тут нужен движок «распознавания текста» — таких довольно мало.

vaily Apr 22 2014 at 20:41

Собственно, даже сложные иероглифы вроде 警 айпад распознает без проблем( не говоря уж об элементарных вроде 水 или 兰）Хотя, правда, только по одному иероглифу. Но и то, я ведь иностранец, и пишу как ребенок лет пятнадцати.

V2008n Apr 22 2014 at 20:45

Занятная какая формула на КДПВ.

eugenelivshitz Apr 23 2014 at 15:03

Сравнение с системой ввода иереглифов на айОС устройствах, где известна одномерная траектория, не вполне корректно. Дело в том, что наша система позволяет также индексировать бумажные заметки по их фотографиям (так называемое оффлайн распознавание), а эта задача значительно сложнее.
Кроме того, если мы говорим про распознавание по траектории (онлайн ввод), то задача распознания целой страницы также не сводится напрямую к системе посимвольного ввода. Во-первых, есть проблемы с сегментацией, а во-вторых, практика показывает, что при посимвольном вводе, человек неявно подстраивается под систему.