Комментарии 19
Рассказ впечатляет.
Поздравляю с подвигом! Желаю и дальше уверенным шагом доказывать конкурентам, что вы круче. :-)
Поздравляю с подвигом! Желаю и дальше уверенным шагом доказывать конкурентам, что вы круче. :-)
Спасибо на добром слове ) Ну, мы больше для пользователей стараемся, чем для конкурентов, если честно :)
Неплохие, но конкуренты тоже не дремлют. Акробат иной раз куда лучше распознает и точнее форматирование сохраняет, а еще он умеет добывать буквы из самого пдф (если они там есть), а файнридер только распознавать насколько я в курсе. Ну и по мелочам с опциями сканирования. нельзя сохранит в пдф не распознав текст… Еще есть куда расти ABBYY.
а файнридер только распознавать насколько я в курсе
Вы неправильно в курсе. FineReader проверяет текст внутри PDF на разумность (часто там путанница с кодировкой или текст подложен под изображение каким-то левым OCR), и если все хорошо, то используется готовый текст.
нельзя сохранит в пдф не распознав текст
См. тут
Не знаю насчет того как будет работать, но думаю модуль обычного сохранения пдф один и тот же. Без распознавания к примеру режет текст, если страница была перевернута в ручную, еще там есть проблема. В общем лучше распознавать.
Наверное, вам нужен ABBYY Pdf Transformer +
А вот этот текст напечатан на старом принтере – в буквах видны отдельные точки и расстояния между ними
— и что ни говори, такой текст читается (человеком) значительно легче всех других. При этом и печатать можно на любой бумаге (или даже не бумаге) и расход ленты небольшой.
У Человека алгоритмы распознавания символов намного лучше.
Я видимо не совсем правильно выразился. Имелась ввиду читабельность текста на «старом» матричнике и «новом» в приведённых примерах, а не в сравнении человек-машина. Это и так понятно, что человек может много чего распознать лучше. Или я где-то не прав?
Человек может распознать даже рецепт, выписанный от руки врачом! Если, конечно, распознавать будет другой врач.
А тут в дело и вступают алгоритмы Человека. Они реально очень продвинутые, поэтому точки заливаются до целого символа быстро и без ошибок. Тем более, что мы смотрим на текст удалённо, а на таком расстоянии точки и сами сливаться могут. Ну и не стоит забывать, что техника была сделана человеком для человека. Никто не стал бы делать принтеры, которые печатают текст для человека, человеку непонятный.
Про удобство можно поспорить — люди разные и у каждого свои предпочтения. Выскажу предположение, что между символами и фоном меньше контрастности и это меньше «бьёт» по глазам, из-за чего и возникает чувство комфорта.
Про удобство можно поспорить — люди разные и у каждого свои предпочтения. Выскажу предположение, что между символами и фоном меньше контрастности и это меньше «бьёт» по глазам, из-за чего и возникает чувство комфорта.
Выскажу предположение, что между символами и фоном меньше контрастности и это меньше «бьёт» по глазам, из-за чего и возникает чувство комфорта
Эта версия мне нравится. Хотя это всё наверное и правда субъективно, и кому-то удобнее читать какой-нибудь condensed шрифт (сжатый), а иные и вовсе капсом пишут и думают, что так и надо.
Деньги-то всем вернули?
Спасибо за такое подробное объяснения методов распознования. Жаль только, что они настолько эффективно работаю только в больших и серьезных проектах. В переводческом софте распознавание текста с изображения все еще остается большой проблемой
У меня возник вопрос другого плана — много ли предприимчивый бразильский гражданин на своем обращении?
С уважением к бразильцу: скорее всего его зовут João Rotta, что на русский обычно транслитеруется как Жоао (с вариациями вроде Жоау… но никак не Джао).
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как мы помогли крупному бразильскому банку справиться с последствиями деноминации