Pull to refresh

Распознаем текст с помощью cuneiform

Configuring Linux
Поступила задача наладить автоматическое распознание текста с фотографий, т.е. пользователь при загрузке фотогографии на сервер, получает еще и распознанный с нее текст. Сказано — сделано. Было найдено хорошее бесплатное консольное решение — cuneiform. Никсовая версия лежит здесь: https://launchpad.net/cuneiform-linux.

Итак, установка. В Убунте кстати доступна версия 0.7 из репозитариев. Версия 0.9 является последней на данный момент.
<br> wget http://launchpad.net/cuneiform-linux/0.9/cuneiform-linux-0.9/+download/cuneiform-linux-0.9.0.tar.bz2<br> tar xvjf cuneiform-linux-0.9.0.tar.bz2<br> cd cuneiform-linux-0.9.0<br> mkdir builddir<br> cd builddir<br> cmake -DCMAKE_BUILD_TYPE=debug ..<br> make<br> make install<br>
Дополнительный аргумент "-DCMAKE_INSTALL_PREFIX=/your/dir" установит cuneiform в нужную директорию.
Запускать можно со следующими аргрументами:

-l
Указывает язык документа. Из возможных: eng(по умолчанию) ger fra rus swe spa ita ruseng ukr srp hrv pol dan por dut cze rum hun bul slo lav lit est tur.

-o
Сохраняет в файл.

-f
Формат полученного текста. Из поддерживаемых: text(по умолчанию), html, rtf, smarttext(plain text with TeX paragraphs), hocr(hOCR HTML format), native(Cuneiform 2000 format)

--dotmatrix
Оптимизация работы скрипта под изображение, распечатанное с помощью матричного принтера.

--fax
Оптимизация работы скрипта под изображение, распечатанное с помощью факса.

--singlecolumn
Отключает анализ страницы и подразумевает, что у нас изображение состоит из одной колонки текста.

Пример использования:
cuneiform -l ruseng -o /our/dir/text.txt /our/dir/book_1.tif

GUI


Далее захотелось уже графический интерфейс под бытовые нужды. Есть 2 штуки на выбор — это YAGF и Cuneiform-Qt:

YAGF

Cuneiform-Qt

Было решено пользовать YAGF. Он тоже написан на qt и требует еще пакет проверки орфографии aspell. Скачиваем, устанавливаем:

wget http://symmetrica.net/cuneiform-linux/yagf-0.8.1.tar.gz<br> tar xvfz yagf-0.8.1.tar.gz <br> cd yagf-0.8.1/<br> cmake ./<br> make<br> make install<br>
Tags:распознание текстаcuneiformyagfcuneiform-q
Hubs: Configuring Linux
Total votes 68: ↑60 and ↓8+52
Views28K

Popular right now