Pull to refresh

Удивительные приключения лицензионного пользователя FineReader

Reading time 3 min
Views 776
Software
Купил домой программу распознавания текстов — знаменитый ABBYY FineReader. На профессиональную версию денег нет (просят аж 3750 рублей), поэтому приобрел домашнюю за 990. Интересно, что профессиональная версия имеет номер 8.0. Домашнюю версию за, отмечу, ощутимые деньги продают еще предыдущей версии 7.0, версии 8.0 в продаже нет. Подход производителя уже порадовал.

Фирма ABBYY примечательна тем, что, разрабатывая прекрасные, а местами — просто выдающиеся программные продукты, она старается максимально усложнить жизнь легальным пользователям своих программ. С давних времен притчей во языцех стали всевозможные извращенные защиты от копирования, притом что пиратские диски с продуктами ABBYY продавались на каждом углу. Два года назад мне подарили лицензионный Lingvo — так его нужно было ставить при помощи ключевой дискеты (дискеты! это в 2005 году-то!), притом что дисковода для таких дискет у меня на ноутбуке не было (к тому времени на ноутбуки их ставить перестали); как оказалось, можно активировать продукт и по телефону/интернету, но поначалу дискета шокировала. Сейчас тоже закрались нехорошие подозрения, хотя в комплекте поставки продукта был только CD-диск — без всяких дурацких дискет.

До установки FineReader у меня руки не дошли, решил, что его установит жена, к тому же программа покупалась для нее, ей нужно по работе много документов распознавать, а у меня таких задач как-то и нет. Бумажная инструкция по установке, прилагавшаяся к диску, говорила, что нужно лишь вставить диск и программа установки запустится автоматически — в общем, обычная процедура. Но все оказалось не так просто: фирма ABBYY очередной раз не подвела!
Читать дальше →
Total votes 74: ↑63 and ↓11 +52
Comments 112

FineReader 9.0: новый революционный размягчитель твердых копий

Reading time 1 min
Views 613
Software
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Rating 0
Comments 0

FineReader 9.0: новый революционный размягчитель твердых копий

Reading time 5 min
Views 1K
Lumber room
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Total votes 43: ↑37 and ↓6 +31
Comments 167

FineReader Online

Reading time 1 min
Views 2.8K
Image processing *
Неужели, чтобы распознать всего одну страничку нужно лезть на торренты идти в магазин и покупать целый FineReader? Правильный ответ – НЕТ, потому что теперь можно купить половинку FineReader’а недавно специально для таких случаев был запущен в открытое бета-тестирование новый онлайн-сервис от ABBYY!

Мы рады представить вам FineReader Online (beta). Теперь те, кому нужно просто распознать парочку страниц, могут зарегистрироваться на нашем сервисе и сделать это совершенно бесплатно. На данный момент после регистрации вам доступно 50 страниц в день.
Читать дальше →
Total votes 120: ↑112 and ↓8 +104
Comments 140

FineReader Express Edition for Mac

Reading time 1 min
Views 2.1K
Content AI corporate blog
Я тут внезапно выяснил, что в пылу борьбы за FineReader Online совсем забыл поведать Хабру о FineReader Express Edition for Mac. А ведь это новость, да ещё какая!

Итак, что же он собой представляет?
Total votes 32: ↑22 and ↓10 +12
Comments 50

FineReader Online — beta 2

Reading time 1 min
Views 688
Lumber room
Больше двух месяцев прошло с того момента, как мы заявили на Хабре о запуске своего сервиса онлайн-распознавания — ABBYY FineReader Online. За это время мы узнали, что не боимся хабраэффекта, прочитали не одну сотню отзывов, услышали массу комментариев и проанализировали десятки пожеланий. И все эти два месяца мы работали над тем, чтобы сделать наш сервис ещё лучше!

Итак, что же поменялось?
Читать дальше →
Total votes 52: ↑48 and ↓4 +44
Comments 44

OCR online

Reading time 3 min
Views 5.2K
Self Promo
С технологией оптического распознавания текста я познакомился где-то в 1997 года, когда купил свой первый, тогде ещё ручной, чёрно-белый сканер Genius ScanMate 256 (кстати, всё ещё рабочий). К сканеру прилагалась программа Direct OCR на 3х дюймовой дискете (блин, откуда-то из подсознания все эти названия всплывают), которая всеми своими силами пыталась доказать, что можно быстро и почти без ошибок текст из книги ввести в компьютер. Ну, доказательства были не очень. FineReader, с которым я познакомился позже, делал это качественнее. Тема распознавания меня заинтересовала, я потратил довольно много времени на научно-популярные статьи о технологиях OCR.

В 2001 году я готовил дипломную работу по web-технологиям. Долго думал о том, куда приложить знания. Поскольку меня интересовала технология OCR, я задумал совместить WEB и распознавание текстов. За само распознавание у меня должен был отвечать FineReader. С друзьями мы «разобрали» FineReader на отдельные DLL и выяснили, как вызывать отдельные функции этих библиотек, передавая двоичные данные изображений, и как получать обратно распознанный вариант текста. Над этим всем был построен простейший веб-интерфейс, чтобы загружать картинки, запускать распознавание и получать результат.
Читать дальше →
Total votes 48: ↑45 and ↓3 +42
Comments 31

FineReader Online — Beta 3

Reading time 2 min
Views 588
Lumber room
FineReader Online

3 месяца прошло с момента выпуска второй беты нашего сервиса и благодаря вам мы подготовили еще несколько вкусностей для наших пользователей. Почему благодаря вам? Да потому, что именно пожелания хабрапользователей легли в основу большинства наших доработок. Итак, обо всём по порядку!
Читать дальше →
Total votes 49: ↑47 and ↓2 +45
Comments 50

Вышел FineReader 10!

Reading time 3 min
Views 1.9K
Content AI corporate blog
Уже несколько месяцев как вышел, успел получить немало лестных отзывов и даже одну (надеемся, не последнюю) весьма важную награду. 4.5 звёзд из 5 от PCMagа, сами понимаете, за «Hello, world» не дают. Более того, ходят слухи, что столько не ставили ещё ни одному OCR! Так вот, мы, значит, стараемся-стараемся, а на Хабре ни слуху, ни духу: всё FineReader Online, да FineReader Online. Нехорошо. Давайте разберёмся,

Чего же ждать от FineReader 10?


Читать дальше →
Total votes 69: ↑53 and ↓16 +37
Comments 72

Давид Ян (ABBYY) о том, как был создан FineReader

Reading time 5 min
Views 666
Lumber room
Был недавно на встрече некого клуба, где выступал Давид Ян (основатель компании ABBYY). Часть выступления записал на телефон. Расшифровку записи представляю Вашему вниманию.

--------------------------------
Если компания выходит на рынок и на этом рынке уже есть что-то похожее, то, об этом можно прочитать во многих книжках, в частности по ведению военных стратегий. Идея основная заключается в следующем: Чтобы не сталкиваться с сильным конкурентом что называется «на его поле». То есть необходимо находить своё поле боя, там где конкурент абсолютно беззащитен и никогда не собирался даже выставлять силы.

Приведу пример: в своё время мы выходили с продуктом под названием Fine Reader. В 92 году ко мне подошел Костя Анисимович, наш technology officer, и сказал «давай сделаем нашу собственную систему распознавания». Это выглядело абсолютно как безумие, потому что
Читать дальше →
Total votes 27: ↑25 and ↓2 +23
Comments 3

Технологии FineReader для Linux

Reading time 2 min
Views 20K
Content AI corporate blog
SDK for Linux Вы спрашивали: что ABBYY выпускает помимо всем известных FineReader и Lingvo? А на нашем форуме люди часто спрашивают: не планируем ли мы выпустить FineReader под Linux? Так вот, этот пост — ответ на оба этих вопроса! Файн под линукс уже давно существует в виде API и называется FineReader Engine. А совсем недавно мы выпустили новую, 9-ю версию энжина для линукс, которая ещё быстрее, ещё точнее распознаёт большее число языков. Подробнее о том, что такое FREngine и кому он нужен, написал Василий Панфёров — Руководитель отдела разработки технологических продуктов.
Читать дальше →
Total votes 56: ↑46 and ↓10 +36
Comments 55

Разогнанный движок – ABBYY FineReader Engine 10 для Windows работает намного быстрее

Reading time 3 min
Views 15K
Content AI corporate blog ECM *
На прошлой неделе мы выпустили очередную версию OCR SDK – продукта для встраивания технологий распознавания текста в различные приложения. Уже в течение многих лет выпуск пользовательского коробочного FineReader’a мы дополняем тиражом кружек и маек выпуском соответствующих технологий в виде SDK – FineReader Engine (для краткости его зовем FRE).

Под катом я расскажу об улучшениях нового FRE по сравнению с предыдущими версиями.
Читать дальше →
Total votes 32: ↑28 and ↓4 +24
Comments 19

Каждому студенту – по «хомяку»

Reading time 2 min
Views 12K
Content AI corporate blog
image
Пару недель назад вышла облегчённая версия ABBYY FineReader 10 – Home Edition (мы её ласково называем «хомяк»). «Домашняя» версия нашего любимого продукта создавалась на тех же технологиях, что и Professional Edition (возможно, вы уже читали о нём на Хабре), но в ней меньше функций. «Лёгкий» (читай: дешёвый) FineReader 10 уже давно ждала студенческая братия – наконец, дождалась :)

Что умеет этот зверь
Total votes 46: ↑37 and ↓9 +28
Comments 35

По следам ошибок распознавания

Reading time 4 min
Views 11K
Content AI corporate blog
Перекличка в армии
— Иванов!
— Я!
— Петров!
— Я!
— тридцать-тридцать!
— ???
— тридцать-тридцать, есть такой???
— Товарищ лейтенант! Моя фамилия Зозо.

Анекдот.


Все мы знаем, что программы распознавания документов иногда ошибаются. Действительно, если бы они не ошибались, не нужен им бы был развесистый пользовательский интерфейс с текстовым редактором. Наш FineReader, увы, всё ещё не исключение, но не в этом суть. Программы распознавания существуют уже довольно давно, столько же существуют и их ошибки… Кто из нас не сталкивался с фразой вроде «иду но дороге» в оцифрованной книжке? Давайте сегодня поищем эти милые шалости распознавалок, посмотрим, как они в конечном счёте повлияли на наш язык, как наблюдаемый объект – попробуем заметить статистически уловимые аномалии. Да, разумеется, при серьёзном языковом исследовании лингвист наверняка сумеет отделить зёрна от плевел, но, вот увидите, плевелы тоже весьма интересные попадаются.

Сразу оговорюсь. Не все найденные аномалии ведут происхождения от FineReader’а, хотя ко многим он приложил руку. Итак, начнём.
Читать дальше →
Total votes 56: ↑48 and ↓8 +40
Comments 29

Автоматизация «Почты России», ABBYY, Abode и Прекрасный Всадник

Reading time 1 min
Views 512
Lumber room


Нам всем хочется, чтобы Почта России стала, наконец, работать хорошо. И когда-нибудь это обязательно произойдет. Но на пути к тотальной автоматизации происходят иногда неожиданные вещи.

Думаю, что компания ABBYY будет неприятно удивлена такому сильному конкуренту.

И под катом прекрасная новость для тех, у кого потерялась посылка.
Читать дальше →
Total votes 31: ↑27 and ↓4 +23
Comments 39

Неочевидные возможности ABBYY FineReader

Reading time 4 min
Views 31K
Content AI corporate blog


Каждая следующая версия ABBYY FineReader становится всё более интуитивно понятной. В частности, в последние версии включена система встроенных сценариев, которые дают возможность выполнить стандартные последовательности действий за несколько щелчков мышью. Так мы стараемся облегчить работу с программой для большинства наших пользователей. И, тем не менее, FineReader обладает рядом возможностей, которые не лежат на поверхности, но могут быть полезны пользователям «продвинутым». О нескольких таких возможностях мы расскажем в этом посте.
Читать дальше →
Total votes 37: ↑33 and ↓4 +29
Comments 23

Как технология MRC уменьшает размер PDF-документов

Reading time 4 min
Views 39K
Content AI corporate blog
Формат PDF уже давно прижился как средство сохранения документов, которые затем не предполагается редактировать. Все PDF файлы можно условно разделить на два класса. Первый – это документы, которые были свёрстаны в цифровом виде, и затем были сконвертированы в PDF. Инструкция к какому-нибудь устройству будет, скорее всего, именно таким файлом. Внутри он выглядит как текст и графика плюс команды форматирования, описывающие, как надо располагать элементы на странице.

Второй класс – это документы, полученные в результате сканирования бумажных изображений. Их можно пропустить через ABBYY FineReader, и они превратятся в первый тип, а можно просто сохранить в PDF как картинки. И этим часто имеет смысл пользоваться, когда хочется сохранить исходный вид документа. Несмотря на то, что ABBYY FineReader довольно хорошо распознаёт документы, возникают ошибки распознавания, какие-то важные элементы на странице не находятся, в общем, то, что получается, по виду несколько отличается от исходного документа.

Поэтому часто имеет смысл сохранять в PDF изображение исходной картинки, а под него подкладывать распознанный текст для того, чтобы можно было найти документ по ключевым словам или воспользоваться copy-paste. Смущает только один момент – такие PDF-файлы имеют немаленький размер, от полумегабайта на страницу и больше. Соответственно, если отсканировать среднего размера учебник по матанализу, получится файл мегабайт на 200.

Под катом подробности и 3,5 Мб картинок
Total votes 80: ↑77 and ↓3 +74
Comments 27

Что общего у монахов, оптического распознавания текстов и козьего сыра?

Reading time 2 min
Views 13K
Content AI corporate blog
Если вы ответите «ABBYY FineReader», то будете правы. Некоторое время назад в американский офис ABBYY обратился отец Григорий, настоятель монастыря Святого Григория Паламы (St. Gregory Palamas Monastery), с просьбой помочь решить необычную задачу, которая стояла перед монастырём. В монастыре хранится архив старых документов на греческом языке с политонической системой диактрики, которые нужно было оцифровать. Узнав об этом, наши американские коллеги подарили настоятелю коробку ABBYY FineReader 10 Professional Edition. Что это за система и почему отцу Григорию понадобился именно FineReader – читайте под катом.
Читать дальше →
Total votes 53: ↑39 and ↓14 +25
Comments 16

Рунетология (107): основатель компании ABBYY Давид Ян

Reading time 1 min
Views 970
Lumber room
Давид Ян — о том, как создавался словарь ABBYY Lingvo, как пираты, сами того не понимая, продвигали продажи компании, о первом в мире коммуникаторе Cybiko, о том, как увлечение ресторанным делом снова привело его в IT, о миссии предпринимателя и неочевидных секретах успеха в бизнесе.
Читать дальше →
Total votes 19: ↑16 and ↓3 +13
Comments 3
1