chronomaster 9 апр 2015 в 01:43

10 способов бумажного шифрования для школьников с помощью ABBYY FineReader

3 мин

32K

Блог компании Content AI

+26

Комментарии 13

JagaJaga 9 апр 2015 в 03:23

«На свете существует 10 типов людей: те, кто понимает двоичную систему счисления, и те, кто не понимает.»

oshibka404 9 апр 2015 в 04:06

Есть два типа людей: которые умеют экстраполировать из неполных данных

НЛО прилетело и опубликовало эту надпись здесь

dtestyk 9 апр 2015 в 03:57

с удивлением, обнаружил в ж шрифте: Y, m, K, Ψ, X, w, динозаврика, змею, черепашку, рыбий хвост, танцора диско

SerafimArts 9 апр 2015 в 04:05

Там ещё Египтяне присутствуют.

k12th 9 апр 2015 в 07:52

Набираем по очереди буквы алфавита и нажимаем «Поезд».

Это ирония?

BubaVV 9 апр 2015 в 09:29

Статью про автоматическое распознавание надо писать автоматическим генератором текста или переводить автопереводчиком

НЛО прилетело и опубликовало эту надпись здесь

datacompboy 9 апр 2015 в 11:54

На картинке если посмотрите есть кнопка «Train».
По-моему это логично — вы набрали кучу картинок и одним поездом его изучили.

k12th 9 апр 2015 в 12:08

Действительно, логично:)

ssh1 9 апр 2015 в 12:16

А почему бы тогда не сделать полностью автоматическое распознавание алфавита(соответствия между символами)? У нас ведь есть информация что это изначально текст на русском языке. Если объем его достаточно большой — задача вполне разрешима.

datacompboy 9 апр 2015 в 12:57

Распознайте 1 картинка = 1 любая буква
А потом обычными средствами статистического анализа

chronomaster 9 апр 2015 в 13:05

Исходный текст на английском, но это не важно.
Основная проблема в том, чтобы правильно найти все картинки. Например, при обучении FineReader упорно не хотел различать буквы i и s (черный круг и черный прямоугольник на белом фоне). Т.е. после обучения одной из этих букв, он не предлагал обучать вторую. На этой стадии скорее всего понадобиться помощь оператора. Ну а после, экспорт в txt и, как уже предложили, разбор обычными средствами статистического анализа.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий