Разогнанный движок – ABBYY FineReader Engine 10 для Windows работает намного быстрее

    На прошлой неделе мы выпустили очередную версию OCR SDK – продукта для встраивания технологий распознавания текста в различные приложения. Уже в течение многих лет выпуск пользовательского коробочного FineReader’a мы дополняем тиражом кружек и маек выпуском соответствующих технологий в виде SDK – FineReader Engine (для краткости его зовем FRE).

    Под катом я расскажу об улучшениях нового FRE по сравнению с предыдущими версиями.

    Разрабатывая новую версию, мы ставим перед собой почти олимпийские цели – точнее, быстрее, функциональнее. Над точностью и функциональностью мы активно работали в девятой версии FineReader Engine и в этом отношении достигли заметных улучшений.

    В десятой версии на первый план вышла скорость. К выпуску нам удалось ускорить Fast Mode (специальный скоростной режим распознавания) в 1,5–2 раза для большинства европейских языков. При этом рост скорости произошел не в ущерб качеству, точность распознавания в Fast Mode осталась в среднем на прежнем уровне. Для русского языка скорость возросла в среднем на 44%. Эти цифры получены в результате внутреннего тестирования на пакетах, содержащих основные типы офисных документов.

    image
    Относительный рост скорости для каждого языка по сравнению с результатами FRE 9.0 (выпуск 21 октября 2008 г.)

    Для основных азиатских языков – китайского, японского и корейского – главной целью по-прежнему была точность. Число ошибок при распознавании документов на этих языках сократилось в среднем на 30-40%. Кроме этого на графике видно существенное повышение скорости.

    Было сделано и много менее очевидных улучшений.

    Новая бинаризация – преобразование цветных и полутоновых изображений в черно-белые. Это необходимый этап подготовки документов к распознаванию, от него зависит, удастся ли на скане мятого листа со следами от пальцев распознать бледный текст. Бинаризация стала значительно лучше, это одна из причин, почему при увеличении скорости не пострадало качество.

    Camera OCRTM – набор специальных преобразований для улучшения качества распознавания текста на сфотографированных документах. Среди них:

    – исправление трапециевидных искажений, которые появляются при съемке под углом,
    – устранение смаза на фотографиях – характерного дефекта при съемке без штатива,
    – сглаживание ISO-шума – множества разноцветных точек на фотографии, появляющихся при высокой чувствительности фотоаппарата в условиях недостаточной освещенности.

    Появились новые возможности ADRTTM – восстановление структуры документа (document map) и оглавления (table of contents – TOC) по заголовкам, автоматическое создание стилей, распознавание подписей к картинкам, задание специального стиля для подписи и объединение картинки и подписи в единый объект.

    Очень важное улучшение – повышение понятности, доступности продукта и облегчение работы с ним. OCR SDK – это многофункциональный инструмент с огромным API, позволяющим настраивать большое число параметров.

    Пользователи решают самые разные задачи. Кто-то разрабатывает системы для сканирования книг из библиотеки в PDF с возможностью контекстного поиска, кто-то реализует автоматическую регистрацию документов в СЭД на основе распознавания штрих-кодов, а кто-то развивает на нем собственные технологии для извлечения данных, используя функцию распознавания и верификации текста.

    Очевидно, что для разных задач – разные требования к функционалу SDK и качеству технологий. В одном случае на первом месте качество и размер получаемых PDF файлов, в другом – точность распознавания текста или штрих-кодов. Следовательно, требуются разные настройки для решения разных задач.

    Чтобы упростить настройку продукта, мы создали ряд профилей, содержащих оптимальные значения параметров для решения конкретных задач. Эта идея отражена на главном «вижуале» продукта:

    image

    Достаточно просто выбрать подходящий профиль – и можно работать.

    Кроме этого была существенно доработана справка по продукту, она стала более структурированной и полной.

    Мы надеемся, что все это поможет быстрее и легче интегрировать FineReader Engine в приложения и получать еще более качественные результаты распознавания.

    Версию FRE10 для Linux мы планируем выпустить примерно через год.

    Семён Сергунин
    Департамент технологических продуктов
    ABBYY
    167,00
    Решения для интеллектуальной обработки информации
    Поделиться публикацией

    Комментарии 19

    • НЛО прилетело и опубликовало эту надпись здесь
        +1
        FineReader SLK
        0
        Результаты тестов внушительные. Очевидно, проделана серьезная работа. Как пользователь выражаю благодарность.
          +1
          Наконец-то стала доступна возможность распознавания структуры документа… Надо потестить

          Теперь бы понять, как это экспортировать бы в удобном виде
            +1
            Пока что только через экспорт в Word или пробегая руками через API. В xml, надеюсь, появится довольно скоро.
            +1
            А сколько стоит сей чудесный продукт в РФ?
              +1
              Цены индивидуальны всегда. Описываете проект и вам называют примерную цену :-)
              Довольно приличную кстати.
              Я общался с российским представительством, мне сказали если наша компания будет зарегана в США, то надо в США обращаться.
                0
                Нашел чудесный сайт www.ocr4linux.com/en:pricing
                  0
                  кхм… мне сейлзы назвали цифру в 3 раза выше чем самая дорогая цена на той странице.
                  и это была цифра ОТ… :-)
                    0
                    Abby Ау! Что там с ценами?
                      0
                      ну я думаю, что всё логично.
                      Мы ищем именно серверное решение, которые будет обрабатывать очень много данных.
                      Отсюда и цена такая была назвала.
                        0
                        Цена очень сильно зависит от требуемой конфигурации, опций и других аспектов и рассчитывается каждый раз индивидуально. Если у Вас предментый интерес, свяжитесь, пожалуйста, с отделом корпоративных проектов ABBYY Россия (495) 7833700
                          0
                          Эм, я вот сайт привел, там вполне адекватная цена без разводов на «опции и друге аспекты». Бери кредитку и покупай, правда у буржуев. А что в России?
                            0
                            По ссылке — не SDK, а готовое решение под Linux — FineReader Engine 8.0 CLI for Linux. Его функции ограничены по сравнению с SDK — FineReader Engine. А главное, у этого продукта нет API для встраивания в другие приложения. Продажами и поддержкой FineReader Engine 8.0 CLI for Linux занимается европейский офис ABBYY и его можно приобрести прямо с сайта по указанным ценам.
                0
                Скажите пожалуйста, а когда появится версия, которую можно было бы использовать в Windows Azure из .Net приложения?

                А то ваше представительство сказало что на данный момент это невозможно.
                  +1
                  В данный момент мы умеем работать в Azure, но только без защиты. Так что для больших проектов проблем нет.
                  Над полноценной поддержкой думаем, но пока это только планы. Следующая, 11я версия, точно будет работать под клаудом, про 10ю пока сказать трудно.
                    0
                    Спасибо за ответ!
                    А что означает «без защиты»?
                      0
                      У нас стандартное ограничение на продукт — это количество обрабатываемых страниц/символов за период. Все счётчики хранятся на жёстком диске и как-то защищены. Если же процесс запускается на виртуальной машине, то мы не можем контролировать, сколько экземпляров виртуалок запущено.

                      Для выделенных серверов эта проблема решается так, что должен быть физический сервер с установленным процессом лицензирования, который занимается хранением и обработкой счётчиков. С облаком такое решение не работает — там все машины виртуальные, и для хранения счётчиков нужно писать особое решение.

                      Если сумма заказа крупная, то мы рассматриваем варианты без счётчиков — в этом случае объём обрабатываемых документов определяется в договорах, а клиент в облаке может запускать столько копий процесса, сколько ему надо.
                        0
                        Определите измеримо понятие «крупный».
                        Допустим 4-5 тысяч одностраничных (в основном) документов в месяц — это крупный заказ?

                Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                Самое читаемое