Как стать автором
Обновить

pytesser — OCR-библитека для языка Python (оптическое распознавание символов)

Время на прочтение1 мин
Количество просмотров15K
Сегодня бродил по проектам на Google и наткнулся на довольно интересную разработку — pytesser. По утверждению разработчика распознать текст на изображении. Библиотека использует tesseract-ocr и PIL.

Пример использования:

>>> from pytesser import *
>>> image = Image.open('fnord.tif') # Open image object using PIL
>>> print image_to_string(image) # Run tesseract.exe on image
fnord
>>> print image_file_to_string('fnord.tif')
fnord


Большим минусом для меня является возможность использования только на Windows. Поэтому я не смог протестировать данную разработку.

В комплекте с библиотекой для теста присутствуют следующее изображение, которое она должна (по идее, раз автор поместил его туда) распознать:

image

Хотелось бы услышать от хабралюдей результаты тестирования на других изображениях.

Официальная страница: code.google.com/p/pytesser
Теги:
Хабы:
Всего голосов 13: ↑11 и ↓2+9
Комментарии6

Публикации

Истории

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
19 сентября
CDI Conf 2024
Москва
20 – 22 сентября
BCI Hack Moscow
Москва
24 сентября
Конференция Fin.Bot 2024
МоскваОнлайн
25 сентября
Конференция Yandex Scale 2024
МоскваОнлайн
28 – 29 сентября
Конференция E-CODE
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
30 сентября – 1 октября
Конференция фронтенд-разработчиков FrontendConf 2024
МоскваОнлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн