Сегодня бродил по проектам на Google и наткнулся на довольно интересную разработку — pytesser. По утверждению разработчика распознать текст на изображении. Библиотека использует tesseract-ocr и PIL.
Пример использования:
Большим минусом для меня является возможность использования только на Windows. Поэтому я не смог протестировать данную разработку.
В комплекте с библиотекой для теста присутствуют следующее изображение, которое она должна (по идее, раз автор поместил его туда) распознать:
Хотелось бы услышать от хабралюдей результаты тестирования на других изображениях.
Официальная страница: code.google.com/p/pytesser
Пример использования:
>>> from pytesser import *
>>> image = Image.open('fnord.tif') # Open image object using PIL
>>> print image_to_string(image) # Run tesseract.exe on image
fnord
>>> print image_file_to_string('fnord.tif')
fnord
Большим минусом для меня является возможность использования только на Windows. Поэтому я не смог протестировать данную разработку.
В комплекте с библиотекой для теста присутствуют следующее изображение, которое она должна (по идее, раз автор поместил его туда) распознать:
Хотелось бы услышать от хабралюдей результаты тестирования на других изображениях.
Официальная страница: code.google.com/p/pytesser