Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
OCR использует искусственный интеллект для поиска и распознавания текста на изображениях.
А на чем тестировали качество?
Интересует виды изображений, размер выборки, мера качества.
Ну вот один в один я точно также прошел такой же путь. Tesseract изначально делался для распознавания сканированного текста, который сканировали именно с отдельных листов. Он и заточен под четкий ровный текст. А у чеков замятия. С камеры прилетит чек под наклоном, тенями, разными артефактами. И никакие фильтры OpenCV не помогут. И в разных местах замятый чек будет иметь разный наклон букв. Бинаризация, выравнивание, медленная обработка… Так что tesseract не для таких задач…
А ABBYY Mobile Capture не тестировали?
https://www.abbyy.com/mobile-capture-sdk/
А пробовали OCR от Azure ? Azure Invoice Recognizer
Распознавание текста с помощью OCR