Pull to refresh

FineReader и Клинопись

Open source *
Клинопись — именно так переводится слово «cuneiform» с английского языка. Правда я немного забежал вперед. Вернемся к первому слову из заголовка. FineReader — идеальное решение для тех, кому нужен высочайший уровень точности распознавания и сохранения оформления текстов, как написано на сайте компании ABBYY. Все очень хорошо, но купить для дома ее, увы, не совсем (или совсем не) рентабельно. Правда есть выход, возможно даже парадный.

OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.

Скрин

OCR CuneiForm это:
  • высокое качество распознавания;
  • высокая скорость работы;
  • распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
  • работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
  • распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
  • автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
  • полное сохранение топологии страницы;
  • поддержка пакетного режима сканирования и распознавания;
  • простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
  • встроенный текстовый редактор для работы с распознанным текстом;
  • совмещенный показ изображений и результатов распознавания.

В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.

Но для нас это не только ценный мех красивые слова, но и… лицензия.
Да, это Open Source. На сайте программы запущен форум для координации работы над проектом Open Source.

На данный момент у программы два недостатка:
  • микрооконность (пока только виндовс, хотя под вайном не пробовал)
  • под вистой не пошло

Сайт программы: http://www.cuneiform.ru/.

UPD:
Заработал под wine из коробки ALT Linux 4.0 Desktop, все распознал (табличка и текст) и сохранил в rtf. Можно скопировать в Openoffice.org
Спасибо, discoverer.
Tags: open sourcefreeнейронная сетьраспознованиекогнитивный ан
Hubs: Open source
Total votes 44: ↑43 and ↓1 +42
Comments 53
Comments Comments 53

Popular right now

Top of the last 24 hours