Как стать автором
Обновить

После двух лет разработки сформирован релиз системы распознавания текста Ocrad 0.29 (Optical Character Recognition), развиваемой под эгидой проекта GNU. Ocrad может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках.

Для оптического распознавания в Ocrad используется метод выделения признаков (feature extraction). В состав входит анализатор макета страницы, позволяющий корректно разделять столбцы и блоки текста в печатных документах. Распознавание поддерживается только для символов из кодировок "ascii", "iso-8859-9" и "iso-8859-15" (поддержка кириллицы отсутствует).

В новой версии GNU Ocrad 0.29:

  • улучшено распознавание начертания буквы "L" с наклонённой правой частью;

  • при использовании опции '‑o' ('‑output') обеспечено создание недостающих промежуточных каталогов, указанных в заданном пути к файлу;

  • в сборочный файл configure и в Makefile.in добавлена переменная MAKEINFO;

  • диагностические сообщения, связанные с файловыми операциями, преобразованы в форму 'PROGRAM: FILE: MESSAGE';

  • в сообщениях об использовании некорректных аргументов командной строки обеспечен показ аргумента и имени опции.

Источник: OpenNET.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Публикации

Истории

Работа

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн
10 – 11 октября
HR IT & Team Lead конференция «Битва за IT-таланты»
МоскваОнлайн
25 октября
Конференция по росту продуктов EGC’24
МоскваОнлайн
7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн