Комментарии 8
эмм… ну как бы все эти инструкции и примеры приведены на гитхабе (и там даже больше). Т.е. вы сделали просто перевод? В чем ценность вашей статьи?
+1
Хотелось бы больше про реальное применение аффинных преобразований и как можно это реализовать в интерфейсе приложения =)
На сколько помню, в лептонике предобработка неплохая получается, правда некоторые заморачиваются и пытаются делать преобразования на стороне. На сколько это оправданно?
На сколько помню, в лептонике предобработка неплохая получается, правда некоторые заморачиваются и пытаются делать преобразования на стороне. На сколько это оправданно?
0
Не отвечу, не приходилось использовать. Если Вы знаете, как можно быстро повысить качество картинки перед распознаванием — напишите сюда в двух-трех словах.
0
Tesseract чувствителен к перепадам яркости, поэтому нелишним будет использовать в качестве препроцессинга либо классический алгоритм автоуровней, либо CLAHE (есть реализация в opencv)
0
На сколько я смотрел вывод лептоники — там как раз и делается суперконтрастность перед распознаванием. То есть, как можно более резкие перепады яркости. Автоуровень или динамическая контрастность — это совсем не то что нужно для правильного распознавания текста. С разпознаванием лиц и объектов немного другая тема и там совершенно другие приемы.
0
Автоуровни не регулируют контрастность, они выравнивают яркость пикселей так, чтобы максимумы яркости в разных частях изображение были примерно одинаковыми. А вот CLAHE в добавок еще и усиляет контрастность.
«Автоуровень или динамическая контрастность — это совсем не то что нужно для правильного распознавания текста.»
Я бы был осторожен с такими смелыми выводами, если бы у меня не было фактов, подтверждающих это. А у вас они есть? Где можно почитать?
«Автоуровень или динамическая контрастность — это совсем не то что нужно для правильного распознавания текста.»
Я бы был осторожен с такими смелыми выводами, если бы у меня не было фактов, подтверждающих это. А у вас они есть? Где можно почитать?
0
Ах, если бы каждый технарь где-то документировал свой ежедневный опыт в доступной для чтения форме — вот зажили бы.
С чего такая уверенность наличия печатны источников, отражающих конкретное мнение автора, высказывающего ту или иную идею?
Можно предположить, что автор работал с распознаванием текста, возможно, даже не только текста, возможно, даже и не один.
В любом случае, нить здравого диалога вы уже оборвали.
Выводы могут быть сколь угодно смелыми, пока это не рецензия, не платная консультация или нечто подобное.
А отчитываться перед первым встречным никто не будет ;-)
С чего такая уверенность наличия печатны источников, отражающих конкретное мнение автора, высказывающего ту или иную идею?
Можно предположить, что автор работал с распознаванием текста, возможно, даже не только текста, возможно, даже и не один.
В любом случае, нить здравого диалога вы уже оборвали.
Выводы могут быть сколь угодно смелыми, пока это не рецензия, не платная консультация или нечто подобное.
А отчитываться перед первым встречным никто не будет ;-)
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Использование Open Source OCR библиотеки Tesseract в Android на примере простого приложения