Здравствуйте, очень интересно(«переводчик с докторского»), хочу это протестировать ;). Мы учли такие данные, как в вашей картинке. («Мы лишились шишок”).
Целью эксперимента было распознать почерк человека для автоматизаций бизнес процессов компании, которые работают с такими данными. Например: „Почта россии“ или же „Казпочта“.
Справедливости ради, даже в русском сейчас (пока что в технической и молодежной среде, но тем не менее) периодически проскальзывают заимствованные слова на языке оригинала. Да и каноническое maman времен имперской литературы — хоть и в прошлом, ситуацию иллюстрирует
Про «поиск в словаре» вспоминается давняя история из середины 90-х. Для одной из газет требовалась перепечатка текстов из других источников. Дабы ускорить процесс, был задействован finereader, который уже тогда довольно неплохо распознавал печатный текст. Важной особенностью программы была коррекция текста с использованием словаря и подсветка текста, который в словаре не содержался.
И вот, выходит очередная газета, а там прекрасная статься, «О национальных видах аборта»…
Ошибок в распознавании не обнаружено! :-D
Эксперимент в распознавании рукописных текстов на кириллице