Вышел FineReader 10!

    Уже несколько месяцев как вышел, успел получить немало лестных отзывов и даже одну (надеемся, не последнюю) весьма важную награду. 4.5 звёзд из 5 от PCMagа, сами понимаете, за «Hello, world» не дают. Более того, ходят слухи, что столько не ставили ещё ни одному OCR! Так вот, мы, значит, стараемся-стараемся, а на Хабре ни слуху, ни духу: всё FineReader Online, да FineReader Online. Нехорошо. Давайте разберёмся,

    Чего же ждать от FineReader 10?


    Первое, с чем столкнётся пользователь —

    Новый интерфейс

    Человек, пользовавшийся FR и раньше, без проблем освоится в «десяточке»: основные окна на своих местах. Самые серьёзные изменения притерпел главный тулбар, а также окно с набором быстрых сценариев.
    Итак, по порядку.
    Приветствовать нового пользователя программа будет вот так:


    Подгружаем картинку, она распознаётся. В результате видим что-то вроде этого (слева — картинка, справа — распознанный текст, который можно тут же редактировать и форматировать):


    Теперь остаётся выбрать только один из многих форматов для сохранения документа и нажать соответствующую кнопочку :)

    В общем, оболочка у нас функциональная (уж поверьте), удобная и красивая, но главное в FR, как ни крути, его технологии. Я могу говорить про них много хорошего, но боюсь, что вы мне не поверите (я ж инсайдер). Поэтому сошлюсь на статью Сергея Голубицкого из ушедшей в онлайн, но от этого не менее уважаемой всеми «Компьютерры». В статье, среди прочего, есть и конкретные результаты работы программы — можете сами посмотреть.

    Думаю самое время перейти к разделу

    Технологические новшества:


    По сравнению с предыдущей версией программы существенно улучшено качество распознавания документов со сложной структурой. Гораздо качественнее обрабатываются изображения низкого качества – факсы и снимки, сделанные с помощью фотокамеры мобильного телефона. А документы, снятые обычными цифровыми фотоаппаратами, FineReader 10 преобразует на 30% точнее предыдущей версии программы. В десятой версии увеличено число языков распознавания – теперь их стало 186. При этом качество «понимания» текстов на азиатских языках улучшилось на 30%, а на европейских – на 20%.

    В программе используется второе поколение адаптивной технологии распознавания документов ADRT2. Пользователю больше не нужно заново форматировать распознанный текст – программа «видит» документ как единое целое, полностью восстанавливая его логическую структуру. Это значительно облегчает дальнейшую работу с длинными или сложными файлами. В новой версии FineReader более точно распознаются номера страниц, сноски, нижние и верхние колонтитулы, подписи к картинкам, стили шрифтов и заголовков, оглавления и разноуровневые заголовки.

    Программа готова «есть» и фотографии, в том числе и весьма низкого качества. Чтобы улучшить качество работы со сфотографированными документами, производится предварительная обработка изображения: корректируются искажения перспективы, исправляются не резкие и смазанные фото.

    Не позабыты и пользователи e-books. В новой версии FineReader появились функции, благодаря которым перевод бумажных книг в электронный вид и работа с ними стали намного проще и удобнее. Так, программа может автоматически сохранять главы книги в отдельные HTML-файлы и восстанавливать ссылки в содержании на соответствующие главы книги. Теперь пользователи e-books смогут самостоятельно создавать файлы для чтения на этих популярных устройствах.

    Конечно же, не обошлось без полной поддержки Windows 7 и ставшего уже традиционным бонуса в виде Screenshot Reader для зарегистрированных пользователей.

    А ещё мне безумно нравится логотип. Вон он какой, смотрите→

    Думаю, что больше писать смысла особого не имеет. Предлагаю продолжить общение в комментариях. Можно задавать вопросы, высказывать пожелания — разработчики готовы отвечать и прислушиваться :)

    И чуть не забыл: триал на 15 дней и 50 страниц тут, а купить коробочку можно здесь за 3950 рублей (ну или за 3550, если коробочка не нужна и Вам достаточно версии для скачивания). Пользователям предыдущих версии — скидки.
    ABBYY
    Решения для интеллектуальной обработки информации

    Комментарии 72

      +7
      И да, всех с наступающей пятницей!
        +10
        эта суббота — рабочий день =\
          +8
          Неееееееееет!!!
          Я про это забыл :(
        0
        Оперативной памяти намного больше 9-ки съедает?
          +2
          В простое сразу после запуска на двухядерном компьютере (не забываем, что FR создаёт на 1 процесс больше, чем количество ядер) все три процесса кушают около 60 Мб, если смотреть по показаниям Task Manager.
          Распознал на английском 86 страниц вот этого файла за 3 минуты на C2D E8400@ 3GHz, 2 Gb RAM. Качество распознавания файла оцениваю как отличное :)
          Пик потребления оперативки — около 300 Мб на все процессы.

          В общем, излишней прожорливостью продукт не страдает и вполне может работать на железе, указанном в минимальных требованиях (P3-1GHz, 512 Mb RAM). Правда, конечно, значительно медленнее :)

          *описанный компьютер — основная рабочая машина тестера, поэтому указанные показатели скорее всего хуже, чем могли бы быть :)
            –1
            > В общем, излишней прожорливостью продукт не страдает

            Ну, это смотря с чем сравнивать. Версия 7ая ФР, например, явно легче. Но если уж 7ой ФР сейчас — это совсем не модно, интерфейс не вписывается в vista-style или еще что, то может ее уже можно сделать freeware?

            И да, нету версии под Linux, что отстойно.

            А все эти проценты улучшения, новые возможности распознавать снимки с телефонов… реклама для студентов и манагеров, наверное.
            +1
            Я на своем старичке ничего такого не заметил) Та же 9-ка, только функциональнее и эффективнее)
              0
              У меня старенький комп (768МБ оперативы 2.5 sempron). 9FR затыкался на больших скринах — мог их пережевывать по 1-2 часа со 100% загрузкой проца, поэтому приходилось их резать.
              Седня попробовал десятку — все прошло на ура. Времени практически столько же ушло — около 3-4 часов(чисто процессорного времени около 50 мин). И, главное, ошибок стало явно меньше, количество неуверенно распознанных символов сократилось от 4 до 2 раз на разных скринах.
                0
                У Вас там картинки 15х15 килопикселей? :)
                  0
                  в среднем 600*9000…
                  тут можно посмотреть пример…
                    0
                    Где Вы их берёте? :)
                      0
                      альдеберан + скриншотплагин.
                      кста, если сохранять их с меньшей глубиной цвета то точность распознавания улучшится??
                        0
                        вот елки… на ник не посмотрел:)
                    0
                    При более подробном рассмотрении, выяснилось что на некоторых страницах процент неуверенно распознаных символов выше, но реальных ошибок больше не стало. Видимо изменили условия ахтунга для неуверенного распознавания.
                  0
                  поменяете мне неиспользованный ABBYY Transformer 2 на это? :) Тоже в коробке.
                  P.S. Получил как приз где-то когда-то.
                    0
                    Больше, чем скидку при покупке новой версии продукта предложить не могу.
                    +8
                    А под Linux?
                      +3
                      Вот вот… Про нас мало кто думает…
                        0
                        Ну или хотя бы ждать или не ждать? И если ждать, то в каком году?
                          +1
                          Пока ничего, кроме SDK у нас под Linux нет.
                          Пользуясь случаем пропиарю веб-сервис finereaderonline.ru/, который в неклинических случаях (не слишком сложный документ и не слишком много страниц) должен Вам помочь. Кроме того, сервис будет продолжать своё развитие. Возможно, в скором времени он будет помогать и в клинических случаях. Следите за развитием событий :)
                          • НЛО прилетело и опубликовало эту надпись здесь
                            –1
                            вы же противники проприетарного ПО.
                              +1
                              сторонники СПО != противники проприетарного
                            +1
                            Слоупоки набегают?
                            Пользуюсь этой версией уже месяца два.
                              +1
                              А я — около года (см. профиль) :)
                              Написал, потому что не было ничего про FR10 ничего на Хабре.
                            • НЛО прилетело и опубликовало эту надпись здесь
                                0
                                Последний абзац смотрите, там с самого начала написано :)
                                +5
                                Наивный вопрос: скидки для бедных студентов не планируете ввести?
                                  0
                                  Ничего о таком не слышал.
                                  На данный момент есть скидки для учебных и медицинских заведений: www.abbyy.ru/licensing/business
                                    0
                                    Но завтра поспрашиваю :)
                                    +1
                                    Такая возможность не исключается. Следите за новостями!
                                      +1
                                      Спасибо :-)
                                    +11
                                    Я думаю, если бы сделали цену за хоум версию в 500 рублей, то многие бы студенты не стали бы качать её с торрентов и конечная прибыль была бы больше.
                                      +8
                                      согласен! Зачем мне, не студенту конечно, но аспиранту, 186 языков, мне 2 хватит, и «хоум» за 500 р. было бы как раз нормально
                                        0
                                        Пожелания передам. Кроме этого по теме скидок мне сказать, к сожалению, нечего.
                                      0
                                      У меня трабла, в 9.0 при распознавании текста с прямой речью вида
                                      — Блаб лабла…
                                      — Блаб ла бла…
                                      Экспорт в .doc производится как ненумерованный список…
                                      как это побороть, чтобы не нарушилось форматирование текста(курсивы и выделения)?
                                      В новой версии это пофиксено?
                                        0
                                        Парсер превратил дефисы в тире.
                                          0
                                          Проблема глобальная или проявляется на конкретном пакете? На пакет в любом случае хочется взглянуть. Если сможете скинуть — пишите в личку, дам Вам свой e-mail.
                                            0
                                            FR9.0 и abbyyonline.com делают одинаково (онлайновый, правда, гораздо хуже распознает прочие символы) в восьмерке тоже были такие проблемы (я сначала думал, что потеря происходила во время конвертирования...). Щас отпишу в личку, Только вот что значит «пакет»? — картинка.
                                            И еще, я распознаю со скринов, но без помощи встроенного скриншотера.
                                              0
                                              Проблема непобедима. Бывают ненумерованные списки, которые начинаются с "-". На них и ориентируемся. Подавляющему большинству пользователей так и надо.
                                                0
                                                Ясно, будем делать автозамену… ФР поймет коды спецсимволов? конец строки, неразрывный пробел и длинное тире?
                                          +2
                                          Круто, что можно сказать. Под linux бы.
                                            0
                                            Присоединяюсь к пожеланию;)
                                              0
                                              Выше уже ответил по этому поводу. Давайте не разводить 2 одинаковых ветки.
                                            +3
                                            Знакома тенденция по ухудшению интерфейса вроде Nero 8 и 9. Сейчас, по сравнению с девяточкой, интерфейс сильно поменяли — причем в лучшую сторону.
                                              0
                                              Спасибо, передам интерфейс-дизайнеру. Ей будет приятно :)
                                                0
                                                Спасибо за новость. Познакомлюсь с FR10 и сделаю детальный обзор FR10 у себя в блоге и журнале.
                                                  0
                                                  Собственно, вот и обзор
                                                0
                                                С каждой версией фирма-создатель всячески убеждает пользователя, что новая версия лучше распознает =)
                                                  0
                                                  Если поверите, то могу как частное лицо сказать, что по моему личному впечатлению FR10 распознаёт лучше, чем FR9. Работа технологов не прекращается и это отражается на характеристиках продукта.

                                                  Кроме того, меня об этом посте даже не просили, я сам изъявил желание написать на Хабре, потому что FR — достаточно известная программа и я не сомневался, что хабраобщественность будет не против такой новости. Тем более приятно чувствовать, что принимаю участие в проекте, который полезен многим людям.
                                                  В общем, рассматривать мою позицию как позицию «фирмы-создателя» не совсем правильно, хотя связующим звеном я могу быть :)
                                                    0
                                                    Я охотно верю, т.к. видел, как распознает 9-ка. Для меня как был 6-й файнридер, так и остался — душа общества :)
                                                  0
                                                  Не могли бы вы подробнее раскрыть красивый маркетинговый лозунг, цитирую:
                                                  — программа «видит» документ как единое целое, полностью восстанавливая его логическую структуру

                                                  Как технически выглядит обработанный документ? В каком виде там присутствуют стили форматирования? Не превратиться ли последующая работа с документом в правку стилей в духе MS Word?
                                                    0
                                                    На моем опыте.
                                                    При распознавании книги, 10ка уверенно распознала все названия глав. В девятке такое было только если название главы было вверху скрина.
                                                      0
                                                      Речь о том, что если раньше (до 8 версии включительно) мы старались сосредоточиться на распознавании символов, то теперь идём несколько дальше — делаем всё больший и больший акцент на то, что «вот это — колонтитул, а вот это — сноска, а вот это — оглавление» и оформляем структурные элементы текста соответствующим образом в результатах экспорта (т.е. в текстовых файлах, которые пользователь получает в результате распознавания).
                                                      Кроме того, при рассмотрении целого документа можно с большей уверенностью говорить, что, например, если на 1,2 и 4 страницах есть колонтитул, то на 3 вооон та строка тоже может им быть. Т.е. пытаемся искать структурные части, характерные документу (т.е. набору страниц), а не отдельно взятой странице.
                                                    • НЛО прилетело и опубликовало эту надпись здесь
                                                        +2
                                                        пакман поедает вишенку?
                                                          0
                                                          Забавное сходство, особенно если учесть, что изображают эти логотипы совсем разные вещи :)
                                                            0
                                                            Забавное сходство. Особенно если учесть, что логотипы изображают совсем разные вещи :)
                                                            0
                                                            Исчезла ли проблема, когда при выборочном распознавании нескольких страниц из многих, нельзя экспортировать документ — ошибка «не распознаны стили, повторите распознавание для всего документа»?
                                                              0
                                                              Судя по всему, Вы останавливаете процесс, когда распознана часть страниц. Программа устроена так, что сначала распознаются сами символы и им не сопоставляются никакие стили. Соответствие «буква-стиль» выставляется в самом конце процесса, потому что документ рассматривается как единое целое. Если этот процесс не прошёл, то экспортировать программа не разрешает и это логично.
                                                              Если Вам нужно экспортировать часть страниц, Вы должны полностью распознать эти страницы и тогда сможете экспортировать их.
                                                              +1
                                                              Мне FR10 понравилась, раньше работал в 7.0. Текст распознается быстрее, ощутимо быстрее и дизайн порадовал.
                                                                0
                                                                Будет ли в новой версии поддержка грузинского языка?
                                                                  0
                                                                  Пока не планируется.
                                                                  0
                                                                  А почему так нечестно? Для венды триалы есть, а для мака — сразу покупай?
                                                                    0
                                                                    Проблемы с реализацией триала. Мы бы и сами рады триал сделать, но у нас пока не получается :(
                                                                      0
                                                                      o_O
                                                                      На маке очень много триалов, которые фиг сбросишь (не то что в венде). Спросите у Cultured Code, они отлично сделали триал Things :)
                                                                    +1
                                                                    вот уж совсем не будут позабыты читатели ebooks, если текст будет сохраняться сразу в fb2)
                                                                      0
                                                                      Боюсь, что ориентир идет на нужды большинства пользователей...
                                                                      Подавляющему большинству пользователей так и надо.
                                                                      Помнится проскальзывало, что api раскрыли… может можно какойнить плагин для экспорта организовать…

                                                                      Кста, вы на либрусеке под тем же ником?
                                                                        0
                                                                        под тем же )) я вообще не очень честолюбивый, но что узнают — приятно.)) спасибо)
                                                                        вы хотели что-то спросить?
                                                                          0
                                                                          Как решают эту проблему более опытные сканировщики?

                                                                          И какой скриншотплагин кроме фаершота(для фаерфокса, но можно и для любого другого браузера) может делать скрины сразу всех открытых вкладок?
                                                                            0
                                                                            честно, не сталкивался с такой проблемой.
                                                                            единственное, что могу посоветовать — спросить в теме по вычитке на либрусеке или флибусте. там точно помогут.
                                                                    • НЛО прилетело и опубликовало эту надпись здесь

                                                                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                      Самое читаемое