Pull to refresh

Comments 19

Никогда не понимал наличие подобных статей на ресурсе для людей, у которых достаточно IQ, чтобы разобраться в интерфейсе программы. Здесь интереснее читать об алгоритмах, процессах применяемых в компании, о заковыристых багах или нестандартных решениях, о поиске решений, в конце концов.

«Пример 4.» наглядно демонстрирует наличие недостатков в подсистеме распознавания. Пора бы уже реализовать адаптивные к контексту алгоритмы распознавания. Тем более, что формулы достаточно формализованы и обособлены. Так что второй пример не самый удачный.
Спасибо. Как пользователю программы мне пост понравился. Напишите, пожалуйста, про работу с иероглифами.
А что Вас интересует? Может так удастся ответить…
Например вот это:
например, иероглифический (китайский, японский, корейский языки) или арабский текст имеют много особенностей, которые учитываются не всегда, а только при выборе соответствующих языков распознавания.

Какие особенности?
А еще: как для китайского текста указать, что он вертикальный и строки идут справа налево?
Для дальневосточных языков в блоке можно указать строки там, или столбики.
А особенности понятно какие — направление текста в первую очередь. Весьма нетривиальное в китайском — там в столбчатом тексте могут, к примеру, встретиться 2-3 или даже 4 цифры в одном знакоместе.
А вот японцы наоборот, в столбчатом тексте англоязычные вкрапления обычно норовят повернуть на 90 градусов, так, чтобы изх прочитать надо голову набок наклонить.
Это все так или иначе знает любой, кто серьезно использовал FineReader.
Лучше расскажите, какие технологии, которые заложены в него, были реально усовершенствованы за последние хотя бы десять лет его существования. На раскрытие более глубоких подробностей и не надеюсь.
К сожалению — не любой из тех, кто считает что «серьёзно» использует FR :(
Тут же дело не в частоте использования, а в сложности решаемых задач и готовности конкретного человека присмотреться к доступным промежуточным данным и поэкспериментировать.
Да и эта серия статей ещё не закончена, чтобы не забыть чего-то важного — пишите вопросы.

Про улучшения в новых версиях были записи и в данном блоге, вот например про 2 последних версии Windows-версии FR —
habrahabr.ru/company/abbyy/blog/214681/
habrahabr.ru/company/abbyy/blog/126850/
А про используемые технологий найдётся ещё минимум десяток постов — сами полистайте habrahabr.ru/company/abbyy/blog/
Уточните, что особенно интересно из упомянутого в материалах блога (или кроме этого) — поищем автора, могущего и желающего поделиться тайными знаниями :)
Хм, ответ в «чиновник-стайл».
Я написал «кто серьезно использовал», а не «кто считает, что серьезно использовал».
Про частоту использования речи также не было, опять же, «серьезно использовал», а не «много использовал».
Вы мой исходный комментарий вообще читали?
Да, читал.
А вы мой ответ и встречный вопрос, надеюсь, тоже прочитали? Что именно хотелось бы узнать ближе, кроме уже описанного в блоге?
Просто не очень понятно, как правильно понимать фразу «были реально усовершенствованы за последние хотя бы десять лет его существования».
Поясните: если FR научились распознавать обрабатывать :) очень многие ближневосточные и дальневосточные языки — это «реальное усовершенствование», или нет? (При этом очень много работы досталось не только технологиям, но и UI.)
Или если научились (и продолжаем учиться) распознавать обрабатывать фотографии — значимое ли это улучшение, стоит ли о нём писать?
А я думал, что до написания статей крупные компании допускают людей, которые не склонны мгновенно обижаться на объективную критику и сыпать минусами.
Видимо, ошибся.

На вторую часть вашего комментария я пока еще не успел ответить (мне торопиться некуда, да и вам — тоже), но отвечу, не сомневайтесь. Начал с этого, потому что не на сто процентов уверен, что диалог с человеком, который отвечает на то, чего ему не писали, стоит продолжать. Сейчас вы мое сомнение укрепили.
Я на вас не обижался, да и критики не уловил — с чего вы взяли? И про какие минусы речь? (я не спец по «карме» и прочим местным «оттенкам штанов»)
Просто ваша формулировка мне напомнила некоторые… не очень глубокие, скажем так… советы «бывалых» пользователей «молодым» на форуме именно по FineReader.
Я к «советам бывалых на форуме» отношения не имею, к вашим личным ассоциациям — тоже.
Пожалуйста, не переходя на личности и без обсуждений стилистки ответов, поясните, что именно о технологиях Вам было бы интересно почитать.
Вот (ссылка на первую часть из двух) коллега рассказал про то, как работает рекогнайзер. Здесь рассказано о нашем излюбленном алгоритме A*, используемом в нескольких подсистемах. Ещё мы рассказывали про обработку сфотографированных документов. Также честно признались, что с разработкой наших технологий не всё чисто.
Раз уж первый из комментаторов написал что-то про высокий IQ, то, я считаю, и авторы могут рассчитывать, что получат несколько более конкретную заявку.
Расскажите пожалуйста, как устранять искажения сканирования:
1) когда видна обратная сторона листа
2) когда текст возле разворота нечеткий или засерён (очень частая проблема при сканировании книжек в мягком переплете)
Если просвечивают «тени» букв с обратной стороны, вопрос решается повышением контраста и/или гаммы изображения до момента, когда темные буквы станут черными, а светлые тени букв с обратной стороны сольются с белым фоном.

Второе, пожалуйста, проиллюстрируйте картинкой, словесное описание не дает полного представления о вашей проблеме.
Если речь о недостаточной глубине резкости сканера в местах, где бумага не прилегает к стеклу, с этим проще всего бороться не программно (размытое изображение не в фокусе можно, теоретически, восстановить, используя обратную PSF, но не в случае, если степень размывания плавно меняется), а механически: сделать простое приспособление из прижимного стекла и прикрепленного к нему уголка, поддерживающего другую страницу разворота, а вместо сканера использовать камеру на штативе.
Могу, если нужно, изобразить схему конструкции, она достаточно проста.
Вот, например: prntscr.com/51odgn У учебной литературы такая беда распространена повсеместно, а к оригиналам зачастую нет доступа.
С таким оригиналом уже почти ничего нельзя сделать сколько-нибудь автоматизированно: буквы в зоне нерезкости можно вытянуть теми же гаммой и контрастом до того, что форма пятен, в которые они превратились, будет заметно лучше различима, но там вы уже не сможете отличить «д» от «л», «н» от «в» и так далее.
Повторюсь, что если бы текст был размыт равномерно по листу и одинаково на всех листах, натравить на него деконволюцию было бы можно, а тут величина влияния функции размывания меняется от листа к листу и на каждом листе — от края к краю размытой области.
Однажды с удивлением узнал довольно очевидный постфактум лайфхак: обратная сторона листа очень здорово маскируется при сканировании, если к ней приложить очень черный лист бумаги, который, кстати, непринужденно делает копир с открытой крышкой.

Можно ли finecmd.exe показать какой использовать шаблон областей (blk файл)? Или можно ли в командной строке для finecmd.exe указать какую задачу из моих созданных (в котором уже задан blk файл) использовать?

Sign up to leave a comment.