Как стать автором
Поиск
Написать публикацию
Обновить

Комментарии 21

Простите, но первая картинка вырвиглазна.
Уменьшил её более чем на 20 процентов, теперь она не режет так глаза.
Как ты умудряешься быть первым в который раз? O_o
F5-Джедай
Движок Tesseract OCR был одним из лучших 3 двигателей в 1995 году на UNLV Accuracy test. В период между 1995 и 2006 годах он был немного доработан, но это, вероятно, один из наиболее точных OCR движков доступный с открытым исходным. Исходный код будет читать бинарные, серые или цветное изображение и выводить текст.

Местами читать очень тяжело, например, как в приведенном примере.
Спасибо за критику, выделенный кусок текста — это описание, которое я взял с сайта и перевёл, поэтому получилось не очень красиво, теперь как мне кажется стало лучше.
Статья в помощь спамерам.
Не поверите, но на днях игрался с этой библиотекой и тоже хотел написать статью:)
Мне удалось распознать капчи двух крупнейших сотовых операторов и суверенного лепрозория. Занимался этим для саморазвития, даже не знаю, что теперь с этими наработками делать… спамерам отдавать не хочу.
Отдайте админам крупнейших сотовых операторов и суверенного лепрозория. Им пригодится.
ога, и новую капчу, которую после этого поставят не разгадает даже человек)
Меня убивают некоторые капчи из статьи. Такое ощущение что авторы специально старались усложнить жизнь не спамерам, а обычным пользователям. Ставить оранжевые чифры на красном фоне, учитывая то, что машине абсолютно пофиг как сильно в этом случае различаются цвета фона и шрифта — верх глупости.
Друзья, что насчет кириллицы?
Но похоже, это для третьей версии :(
Для второй нет.
Как показал мой личный опыт, третий тессеракт работает с кириллицей довольно скверно. У меня результаты получились хуже, чем на cuneiform.
Небольшая ложка дегтя:
«Tesseract C++ source code is full of memory leak. Using tessnet2 assembly several time will cause memory overflow. This is not tessnet2 leak, this is tesseract leak and I spent two days in tesseract source code trying to improve this with no success. See what I think about this
Шикарно, использовал tessnet2 для License plate recognition. Но были проблемы с нахождением номера на фото, а также если сфотографирован под углом…
Автор подобным не занимался?
Хороший пример реального приложения, но, к сожалению подобных задач я ещё не встречал в своей работе, думаю ещё все впереди.
А вы случайно не заморачивались подготовкой этой библиотеки для распознавания какого-нибудь особенного шрифта? Просто я столкнулся с пробемой, что абсолютно читаемые человеческому глазу черные цифры на белом фоне очень криво распознаются этой библиотекой. А так как распознавать надо только цифры, хочется прям чуть ли не задать ей все картинки цифр вручную. Как лучше это сделать?
Пробовал по инструкции code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3, но что-то очень тяжело все для меня…
Уже нашел и обучалку под .Net, и отличную программу VietOCR, которая позволяет проверить подготовленные по шрифту данные. Ну и чтобы их потом использовать, нужно было просто подобрать работающую библиотечку. Кстати, можно ее взять и из той же программы.
Но в конечном итоге я столкнулся с ситуацией, что несмотря на все обучение и качественную пред-обработку, программа иногда отказывалась распознавать число без указания рамки… В общем, вернулся на старую tesseract2, она работает с дефолтным языком даже стабильнее, чем новая почему-то.
А еще позже я выяснил (это есть в комментарии выше), что эти библиотеки страдают утечками памяти.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации