SlaSapro 30 окт 2014 в 16:11

Укрощение строптивого (на самом деле, нет) FineReader

7 мин

45K

Блог компании Content AIОбработка изображений*

Туториал

+18

Комментарии 19

zoonman 30 окт 2014 в 18:12

Никогда не понимал наличие подобных статей на ресурсе для людей, у которых достаточно IQ, чтобы разобраться в интерфейсе программы. Здесь интереснее читать об алгоритмах, процессах применяемых в компании, о заковыристых багах или нестандартных решениях, о поиске решений, в конце концов.

«Пример 4.» наглядно демонстрирует наличие недостатков в подсистеме распознавания. Пора бы уже реализовать адаптивные к контексту алгоритмы распознавания. Тем более, что формулы достаточно формализованы и обособлены. Так что второй пример не самый удачный.

hmpd 30 окт 2014 в 23:58

Спасибо. Как пользователю программы мне пост понравился. Напишите, пожалуйста, про работу с иероглифами.

57DeD 31 окт 2014 в 00:12

А что Вас интересует? Может так удастся ответить…

hmpd 31 окт 2014 в 00:42

Например вот это:

например, иероглифический (китайский, японский, корейский языки) или арабский текст имеют много особенностей, которые учитываются не всегда, а только при выборе соответствующих языков распознавания.

Какие особенности?
А еще: как для китайского текста указать, что он вертикальный и строки идут справа налево?

57DeD 31 окт 2014 в 13:30

Для дальневосточных языков в блоке можно указать строки там, или столбики.
А особенности понятно какие — направление текста в первую очередь. Весьма нетривиальное в китайском — там в столбчатом тексте могут, к примеру, встретиться 2-3 или даже 4 цифры в одном знакоместе.
А вот японцы наоборот, в столбчатом тексте англоязычные вкрапления обычно норовят повернуть на 90 градусов, так, чтобы изх прочитать надо голову набок наклонить.

Moskus 31 окт 2014 в 07:55

Это все так или иначе знает любой, кто серьезно использовал FineReader.
Лучше расскажите, какие технологии, которые заложены в него, были реально усовершенствованы за последние хотя бы десять лет его существования. На раскрытие более глубоких подробностей и не надеюсь.

SlaSapro 31 окт 2014 в 13:15

К сожалению — не любой из тех, кто считает что «серьёзно» использует FR :(
Тут же дело не в частоте использования, а в сложности решаемых задач и готовности конкретного человека присмотреться к доступным промежуточным данным и поэкспериментировать.
Да и эта серия статей ещё не закончена, чтобы не забыть чего-то важного — пишите вопросы.

Про улучшения в новых версиях были записи и в данном блоге, вот например про 2 последних версии Windows-версии FR —
habrahabr.ru/company/abbyy/blog/214681/
habrahabr.ru/company/abbyy/blog/126850/
А про используемые технологий найдётся ещё минимум десяток постов — сами полистайте habrahabr.ru/company/abbyy/blog/
Уточните, что особенно интересно из упомянутого в материалах блога (или кроме этого) — поищем автора, могущего и желающего поделиться тайными знаниями :)

Moskus 31 окт 2014 в 18:18

Хм, ответ в «чиновник-стайл».
Я написал «кто серьезно использовал», а не «кто считает, что серьезно использовал».
Про частоту использования речи также не было, опять же, «серьезно использовал», а не «много использовал».
Вы мой исходный комментарий вообще читали?

SlaSapro 31 окт 2014 в 19:07

Да, читал.
А вы мой ответ и встречный вопрос, надеюсь, тоже прочитали? Что именно хотелось бы узнать ближе, кроме уже описанного в блоге?
Просто не очень понятно, как правильно понимать фразу «были реально усовершенствованы за последние хотя бы десять лет его существования».
Поясните: если FR научились ~~распознавать~~ обрабатывать :) очень многие ближневосточные и дальневосточные языки — это «реальное усовершенствование», или нет? (При этом очень много работы досталось не только технологиям, но и UI.)
Или если научились (и продолжаем учиться) ~~распознавать~~ обрабатывать фотографии — значимое ли это улучшение, стоит ли о нём писать?

Moskus 31 окт 2014 в 19:32

А я думал, что до написания статей крупные компании допускают людей, которые не склонны мгновенно обижаться на объективную критику и сыпать минусами.
Видимо, ошибся.

На вторую часть вашего комментария я пока еще не успел ответить (мне торопиться некуда, да и вам — тоже), но отвечу, не сомневайтесь. Начал с этого, потому что не на сто процентов уверен, что диалог с человеком, который отвечает на то, чего ему не писали, стоит продолжать. Сейчас вы мое сомнение укрепили.

SlaSapro 31 окт 2014 в 19:51

Я на вас не обижался, да и критики не уловил — с чего вы взяли? И про какие минусы речь? (я не спец по «карме» и прочим местным «оттенкам штанов»)
Просто ваша формулировка мне напомнила некоторые… не очень глубокие, скажем так… советы «бывалых» пользователей «молодым» на форуме именно по FineReader.

Moskus 31 окт 2014 в 20:02

Я к «советам бывалых на форуме» отношения не имею, к вашим личным ассоциациям — тоже.

57DeD 1 ноя 2014 в 16:02

Пожалуйста, не переходя на личности и без обсуждений стилистки ответов, поясните, что именно о технологиях Вам было бы интересно почитать.
Вот (ссылка на первую часть из двух) коллега рассказал про то, как работает рекогнайзер. Здесь рассказано о нашем излюбленном алгоритме A*, используемом в нескольких подсистемах. Ещё мы рассказывали про обработку сфотографированных документов. Также честно признались, что с разработкой наших технологий не всё чисто.
Раз уж первый из комментаторов написал что-то про высокий IQ, то, я считаю, и авторы могут рассчитывать, что получат несколько более конкретную заявку.

MilkyWay 31 окт 2014 в 14:44

Расскажите пожалуйста, как устранять искажения сканирования:
1) когда видна обратная сторона листа
2) когда текст возле разворота нечеткий или засерён (очень частая проблема при сканировании книжек в мягком переплете)

Moskus 31 окт 2014 в 20:13

Если просвечивают «тени» букв с обратной стороны, вопрос решается повышением контраста и/или гаммы изображения до момента, когда темные буквы станут черными, а светлые тени букв с обратной стороны сольются с белым фоном.

Второе, пожалуйста, проиллюстрируйте картинкой, словесное описание не дает полного представления о вашей проблеме.
Если речь о недостаточной глубине резкости сканера в местах, где бумага не прилегает к стеклу, с этим проще всего бороться не программно (размытое изображение не в фокусе можно, теоретически, восстановить, используя обратную PSF, но не в случае, если степень размывания плавно меняется), а механически: сделать простое приспособление из прижимного стекла и прикрепленного к нему уголка, поддерживающего другую страницу разворота, а вместо сканера использовать камеру на штативе.
Могу, если нужно, изобразить схему конструкции, она достаточно проста.

MilkyWay 31 окт 2014 в 21:26

Вот, например: prntscr.com/51odgn У учебной литературы такая беда распространена повсеместно, а к оригиналам зачастую нет доступа.

Moskus 31 окт 2014 в 21:43

С таким оригиналом уже почти ничего нельзя сделать сколько-нибудь автоматизированно: буквы в зоне нерезкости можно вытянуть теми же гаммой и контрастом до того, что форма пятен, в которые они превратились, будет заметно лучше различима, но там вы уже не сможете отличить «д» от «л», «н» от «в» и так далее.
Повторюсь, что если бы текст был размыт равномерно по листу и одинаково на всех листах, натравить на него деконволюцию было бы можно, а тут величина влияния функции размывания меняется от листа к листу и на каждом листе — от края к краю размытой области.

Nashev 2 фев 2015 в 21:57

Однажды с удивлением узнал довольно очевидный постфактум лайфхак: обратная сторона листа очень здорово маскируется при сканировании, если к ней приложить очень черный лист бумаги, который, кстати, непринужденно делает копир с открытой крышкой.

Syzd 2 фев 2022 в 12:18

Можно ли finecmd.exe показать какой использовать шаблон областей (blk файл)? Или можно ли в командной строке для finecmd.exe указать какую задачу из моих созданных (в котором уже задан blk файл) использовать?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий