FineReader и Клинопись

    Клинопись — именно так переводится слово «cuneiform» с английского языка. Правда я немного забежал вперед. Вернемся к первому слову из заголовка. FineReader — идеальное решение для тех, кому нужен высочайший уровень точности распознавания и сохранения оформления текстов, как написано на сайте компании ABBYY. Все очень хорошо, но купить для дома ее, увы, не совсем (или совсем не) рентабельно. Правда есть выход, возможно даже парадный.

    OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

    Скрин

    OCR CuneiForm это:
    • высокое качество распознавания;
    • высокая скорость работы;
    • распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
    • работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
    • распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
    • автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
    • полное сохранение топологии страницы;
    • поддержка пакетного режима сканирования и распознавания;
    • простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
    • встроенный текстовый редактор для работы с распознанным текстом;
    • совмещенный показ изображений и результатов распознавания.

    В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.

    Но для нас это не только ценный мех красивые слова, но и… лицензия.
    Да, это Open Source. На сайте программы запущен форум для координации работы над проектом Open Source.

    На данный момент у программы два недостатка:
    • микрооконность (пока только виндовс, хотя под вайном не пробовал)
    • под вистой не пошло

    Сайт программы: http://www.cuneiform.ru/.

    UPD:
    Заработал под wine из коробки ALT Linux 4.0 Desktop, все распознал (табличка и текст) и сохранил в rtf. Можно скопировать в Openoffice.org
    Спасибо, discoverer.
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 53

      +3
      Спасибо за открытие такого интересного продукта
      • НЛО прилетело и опубликовало эту надпись здесь
        • НЛО прилетело и опубликовало эту надпись здесь
            0
            Ну... для меня, например, это открытие... т.к. 10-12 лет назад меня распознание не сильно интересовало :)
          +4
          Сначало звучало как наглая реклама...

          Спасибо большое за новость!
            0
            Согласен в принципе с вами, я сначала подумал, что вышла новая версия ридера ;) Я думаю автору стоит изменить название на "CuneiForm - программа для распознования текста с открытым исходным кодом". Ну, собственно, ждем ебилдов для Linux, ведь конкурентов у этой программы не будет на этой платформе.
              0
              Linux OCR: A review of free optical character recognition software — правда это если не брать во внимание киррилицу (:
                0
                Спасибо за ссылку, но вы сами понимаете, что под линукс нет аналога FineReader. :)
                  0
                  Увы (:
                  Но ведь никто и не говорит, что ГНУ абсолютно полностью и так же заменит Окна, но бесплатно. У каждой системы свои цели.
              0
              Это и в конце звучит так же o_O
              0
              Хорошая альтернатива файн ридеру. Незнаете, его будут портировать на линукс? и еще вопросик, это не тали программа, которая начала раньше ABBYY, но перестала развиваться году в 2001, а вот в 2007 ее опять расконсервировали под опен сурс?
                0
                Про линукс: читал интервью человека из ABBYY, он сказал, что пока выпускать файнридер (даже) под мак не рентабельно.
                0
                Неплохо было бы что бы её портировали нод *nix... А то чуть ли не только из-за етого установлен вындовс.
                  0
                  Я софт что непортируется под nix и глючит в WINE запускаю на виртуальной винде.
                    0
                    Заработал под вайном?
                      0
                      Заработал под wine из коробки ALT Linux 4.0 Desktop, все распознал (табличка и текст) и сохранил в rtf. Можно скопировать в Openoffice.org
                  0
                  Я испугался в начале, когда автор сказал про "выход", что дальше будут ссылки на кряки и пр. =)

                  А программа очень интересное. Описание заинтриговало. Будет для него работа - обязательно попробую. Спасибо, DorBer!
                    0
                    Попробовал под wine-0.9.52 из коробки (то есть, без каких либо настроек). Установилось, запустилось, открыло картинку. При нажатии на кнопку распознавания выдало сообщение о ошибке в модуле kernel32.dll.
                      0
                      Бубен в руки и вперед :) Почитайте форум, там написано, что надо нативную библиотеку подключить, хотя разумеется это не выход. Проблема в том, что в вайне не все функции реализованы (запустите приложении из консоли - увидите ошибки).
                        0
                        Ясен пень, что можно что-то крутить. Потому я и написал, что пробовал только на коробочном wine. Нет желания и времени сейчас игараться.
                        А в консоле были ошибки, если не ошибаюсь, связаные с COM. Не помню, в общем.
                        Пологаю, что раз движок есть и он open source, то какой-то front-end к нему для unix-ов сделают в скором времени.
                          0
                          1) Про проблемы с вайном авторы знают (http://www.cuneiform.ru/forum/viewtopic.…)
                          2) Как портировать будут не понятно, насколько я понял будет отделен движок и фроненд, возможно они будут с разными лицензиями. Дальше надо либо фроненд переписывать под кроссплатформенный GUI (Qt, например), либо писать разные фроненды.
                            0
                            Пробежавшись по приведенной ссылке, прочитал, что авторы действительно хотят делать кроссплатформенный вариант. Ну и как это можно не приветствовать то!
                            А как... не знаю, но надо по традиции какой-то libcuneiform сделать (= Кстати, по-моему неплохой вариант — это wxWidgets. Он в отличии от Qt, GTK, Tk и других использует родной API системы. А значит работает быстрее, выглядит природнее (:
                            Я сейчас курсовую работу делаю на этих виджетах (на зло преподам, которые задали MFC, но это уже совсем другая история).
                              0
                              Мне почему, то кажется что фронтенд для никсов отдадут на откуп сообществу. Насколько я понял уже есть какие-то варианты фронтендов, хотя я OCR не занимался, так что могу ошибаться.
                                0
                                В общем, будем следить, надеятся и ждать (: (а может кто даже и попишет).
                      0
                      Эх, на мак бы какую-нибудь распознавалку..
                        –6
                        "Все очень хорошо, но купить для дома ее, увы, не совсем (или совсем не) рентабельно."

                        Для дома можно и не покупать.Не согласны? )) А скачать ... серийный номер.
                          0
                          Ох, ничего себе! Он-же раньше был коммерческим продуктом! Спасибо!
                            +1
                            Просто вспомнилось "к теме": Обучение OCR Tesseract русскому языку.
                              0
                              А ведь раньше был он платным. И по качеству был хуже, чем FineReader. Ребята молодцы, что перепрофилировались.
                                0
                                да, причем распознавал значительно хуже...так что я с некоторой опаской смотрю на новый продукт...
                                0
                                А с лицензией так и нет определенности :) Какой-то мутный опенсорс пока.
                                  0
                                  И ссылок на скачивание тоже нема. Может вы поспешили с объявлением того, чего нет?
                                      0
                                      На скачивания исходников, разумеется. А то какой-то фиговый опенсорс.
                                        0
                                        я так понял проект стал открытым и они пока решают под какой лицензией распространять код.
                                          +1
                                          Проект не стал открытым, пока нет исходников. Это то же самое, что закрытая дверь с табличкой "добро пожаловать"
                                            0
                                            какойто бесмысленный спор) я с вами согласен
                                              –1
                                              Хорошая жизнь настанет у ABBY - смотри код, бери оттуда все стоящие идеи созданные комьюнити и включай в свой коммерческий продукт.
                                              Может не стоит ядро открывать?
                                                0
                                                думаю у аби и без того свого кода завались, они же кажtтся целый факультет содержат где учат студентов специально для развития своих проектов, так что для аби код cuneiform как для adobe код gimp-а^).
                                                  0
                                                  А что, я уверен что Адоб за Гимпом следит... Хотя бы на предмет поиска новых талантов среди комьюнити - чтобы к себе затащить.
                                                  В общем, не думаю что они такие уж гордые, чтобы не посмотреть что делается другими по их теме и лежит в открытом доступе.
                                                  0
                                                  А проблемы ABBYY здесь причем? Разработчик OCR CuneiForm - компания Cognitive Technologies.
                                                    0
                                                    Пока, увы, Cuneiform отстаёт от Finereader лет на 5-6, так что халява файнридерщикам не обломится.
                                          0
                                          А кто то уже пробовал его в реальной жизни (именно последнюю версию)? Какие результаты по сравнению с FineReader? Форматирование не интересует.
                                            0
                                            Он у меня даже границы текста не нашел. Правда, бледноватый был скан. Распознает хорошо сосканированное на ура, где похуже в углу — выдает кракозябры всякие, вроде кучи скобок. Вобщем, для дома раз в месяц сойдет пока.
                                            0
                                            Спасибо. Скачал и добавил в свой открытый каталог.
                                              0
                                              А где этот каталог?
                                                0
                                                Ссылка у меня в профиле.
                                              +1
                                              А под Вистой не идет принципиально?
                                              (Я несчастный, вынужденный обладатель висты, хлип)
                                                0
                                                Решение есть
                                                http://www.cuneiform.ru/forum/viewtopic.php?t=16
                                                0
                                                Странно что никто не спросил что такое "нейронные сети", я по ходу один не знаю что это такое?
                                                  0
                                                  Я спросил у гугля, первая ссылка дала мне исчерпывающий ответ.
                                                  0
                                                  Иску
                                                    0
                                                    Ау сори хотел небольшую статейку выложить, переглючило.

                                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                    Самое читаемое