Обновить
16K+
137

Пользователь

0,2
Рейтинг
109
Подписчики
Отправить сообщение

ABBYY FlexiCapture Engine 9.0: технология извлечения данных из документов теперь доступна разработчикам

Время на прочтение5 мин
Охват и читатели10K
imageНедавно мы выпустили ABBYY FlexiCapture Engine 9.0 – новую версию инструментария для разработчиков (SDK) на основе технологии ABBYY FlexiCapture. Эта технология позволяет извлекать данные не только из документов с жёсткой структурой (анкет, экзаменационных тестов, бланков), но и из слабоструктурированных и вовсе не структурированных документов (писем, статей, контрактов).

Продукты на основе нашей технологии извлечения данных используются в разных проектах по всему миру и решают как узкоспециализированные задачи в отдельных отраслях (образование, банковский сектор, страхование, телекоммуникации и других), так и крупные задачи в проектах национального масштаба (единый государственный экзамен ЕГЭ в России, перепись населения в ряде стран, выборы президента в Чили, система ввода отчетов Государственного центра занятости Украины).

ABBYY FlexiCapture существует как в виде готового кастомизируемого решения, так и в форме SDK. Зачастую глубокая интеграция подсистемы ввода данных в информационную систему заказчика оказывается невозможной при использовании готовых решений. В этом случае на помощь приходит наш SDK, и сейчас мы расскажем вам о том, как он работает и в каких проектах используется.
Читать дальше →

delete, new[] в C++ и городские легенды об их сочетании

Время на прочтение5 мин
Охват и читатели75K
Если в коде на C++ был создан массив объектов с помощью «new[]», удалять этот массив нужно с помощью «delete[]» и ни в коем случае не с помощью «delete» (без скобок). Разумный вопрос: а не то что?

На этот вопрос можно получить широчайший спектр неразумных ответов. Например, «будет удален только первый объект, остальные утекут» или «будет вызван деструктор только первого объекта». Следующие за этим «объяснения» не выдерживают обычно никакой серьезной критики.

В соответствии со Стандартом C++, в этой ситуации поведение не определено. Все предположения – не более чем популярные городские легенды. Разберем подробно, почему.
Читать дальше →

Неочевидные возможности ABBYY FineReader

Время на прочтение4 мин
Охват и читатели32K


Каждая следующая версия ABBYY FineReader становится всё более интуитивно понятной. В частности, в последние версии включена система встроенных сценариев, которые дают возможность выполнить стандартные последовательности действий за несколько щелчков мышью. Так мы стараемся облегчить работу с программой для большинства наших пользователей. И, тем не менее, FineReader обладает рядом возможностей, которые не лежат на поверхности, но могут быть полезны пользователям «продвинутым». О нескольких таких возможностях мы расскажем в этом посте.
Читать дальше →

Генеральный директор ABBYY Сергей Андреев отвечает на вопросы читателей Хабра об участии компании в проекте Сколково

Время на прочтение2 мин
Охват и читатели15K
image
В конце 2010 года проект компании ABBYY по разработке новой технологии перевода текстов и анализа текстовой информации стал один из первых резидентов Сколково. Впоследствии фонд Сколково счел возможным поддержать этот проект грантовым финансированием в размере 474 996 тыс. рублей.

Мы давно разрабатываем этот проект и не хотели делать его публичным до момента выпуска готовых продуктов. Однако приход этого проекта в Сколково очевидно требует понятного рассказа об истории проекта, его текущем статусе и перспективах. Мы хотим рассказать много интересного о том, чем компания ABBYY занималась последние 10 лет в закрытом режиме и какое взаимодействие с проектом Сколково мы планируем.

Мы хотим предоставить вам возможность получить информацию из первых рук – задать вопросы генеральному директору компании ABBYY Сергею Андрееву. Под катом его краткая профессиональная биография. Свои вопросы Сергею (и не только про Сколково) вы можете задавать в комментариях, Сергей ответит на них в ближайшем посте.

Update: Спасибо всем за вопросы! Топик с ответами Сергея появится на следующей неделе.

Читать дальше →

ABBYY Lingvo Intranet Server

Время на прочтение2 мин
Охват и читатели6.3K
image
Несмотря на то что словарям ABBYY Lingvo уже больше 20 лет и в последние годы большая часть продаж приходилась на корпоративный рынок, специальный продукт для организаций в Лингво-линейке появился только в прошлом апреле. А на Хабре мы рассказываем о нем впервые только сейчас. Итак, представляем ABBYY Lingvo Intranet Server (LIS).
Читать дальше →

Всем мужчинам – (авто)мобильные подарки!

Время на прочтение1 мин
Охват и читатели1.6K
23 февраля – праздник настоящих мужчин. А так как большинство современных мужчин имеет автомобиль (и зачастую нероссийского производства), им просто необходим словарь, который будет всегда под рукой и в котором будут названия всех, даже самых мелких, деталей их авто.

Поэтому мы решили сделать подарок настоящим мужчинам: с 23 по 26 февраля включительно автомобильные словари Lingvo для iOS буду доступны для бесплатного скачивания из приложения.
6 автомобильных словарей позволят перевести хитрое название любой детали, с английского, немецкого или итальянского языка на русский и обратно. Или просто наконец-то узнать, что такое иммобилайзер

Само приложение Lingvo Dictionaries (из которого можно будет скачать словари, в т.ч. автомобильные) до 26 февраля включительно доступно по минимальной цене: $0,99

Ну а для тех, в чьих руках визитки бывают чаще чем рычаг КПП, до 25 февраля действуют ооочень хорошие скидки на Business Card Reader-ы, для iPhone и Android.

С праздником, мужчины!

Подарки ко Дню Святого Валентина!

Время на прочтение1 мин
Охват и читатели2.7K
<irony> В этот знаменательный день разрешите преподнести Вам сей скромный презент». </irony>

День Всех Влюбленных давно уже стал для всех нас родным и близким (почти как Масленица). В этот день хочется сделать что-то приятое для близких, любимых людей, поэтому 14 февраля обычно наполнен плюшевыми сердцами, воздушными шарами, цветами и записками. Вот и мы решили сделать маленькую приятность. Во-первых, специально к этому дню мы добавили в Lingvo «Он и Она: женско-мужской словарь». Это толковый словарь, который показывает, как мужчины и женщины воспринимают одни и те же слова. Может быть он поможет вам чуть лучше понимать друг друга=) (Офф: только, пожалуйста, не принимайте его близко к сердцу – он всё-таки шуточный=) )

Во-вторых, маленькие утилиты для iPhone LinkGrabber, PhoneGrabber и MailGrabber, избавляющие от ручного ввода URL, телефонов и e-mail, вы сможете сегодня заполучить безвозмездно, то есть даром!

Погодите, это ещё не всё. Lingvo Dictionaries, а так же BCR-ы, для iPhone и для Android, будут сегодня доступны с приятными скидками.

Надеемся, что у вас сегодня будет ещё много больших и маленьких радостей/сладостей/вкусностей.

С Днем Святого Валентина, товарищи!

C++, приведение в стиле C и неожиданные последствия их сочетания

Время на прочтение5 мин
Охват и читатели18K
C++ получил в наследство от C приведение вида (тип)(что привести) – обычно называется приведением в стиле C. В C++ есть еще четыре явных приведения – static_cast, reinterpret_cast, dynamic_cast, const_cast.

C++ – не самый новый язык, и жаркие споры о том, что лучше – приведение в стиле C или использование *_cast в нужном сочетании, начались давно и не утихают по сей день. Не будем подливать масла в огонь, лучше рассмотрим пример, и пусть каждый сам решит, что ему нравится больше.
Читать дальше →

Как ABBYY FineReader Engine распознаёт данные на чертежах

Время на прочтение2 мин
Охват и читатели11K
Многие из нас помнят со школьных уроков черчения вот такие таблички, которые нужно было рисовать на каждом листе в правом нижнем углу. По ним всегда можно было быстро найти нужный чертеж в папке. Быстро? Ну, пока речь идет о чертежах, которые влезают в одну папку, – да. А если это целый шкаф технической документации?
Читать дальше →

Каждому школьнику – по словарю Lingvo

Время на прочтение2 мин
Охват и читатели6.8K

Информационные технологии все больше проникают в различные сферы образования. Наша компания тоже участвует в этом позитивном процессе. Уже с ноября прошлого года российские школьники могут пользоваться словарём ABBYY Lingvo и обучающей программой Tutor вместе с учебниками английского языка издательства «Просвещение» – теперь они поставляются вместе с компакт-дисками с нашими программами.
Читать дальше →

История ABBYY Lingvo. Четыре-ноль

Время на прочтение1 мин
Охват и читатели13K
В отличие от Lingvo 3.0, существующей только в виде пятидюймовых нечитаемых дискет и руководства пользователя, четвертой лингве повезло больше :)

Итак, Lingvo 4.0, 1993 года выпуска, работает под DOS и Windows.



Читать дальше →

По следам ошибок распознавания

Время на прочтение4 мин
Охват и читатели11K
Перекличка в армии
— Иванов!
— Я!
— Петров!
— Я!
— тридцать-тридцать!
— ???
— тридцать-тридцать, есть такой???
— Товарищ лейтенант! Моя фамилия Зозо.

Анекдот.


Все мы знаем, что программы распознавания документов иногда ошибаются. Действительно, если бы они не ошибались, не нужен им бы был развесистый пользовательский интерфейс с текстовым редактором. Наш FineReader, увы, всё ещё не исключение, но не в этом суть. Программы распознавания существуют уже довольно давно, столько же существуют и их ошибки… Кто из нас не сталкивался с фразой вроде «иду но дороге» в оцифрованной книжке? Давайте сегодня поищем эти милые шалости распознавалок, посмотрим, как они в конечном счёте повлияли на наш язык, как наблюдаемый объект – попробуем заметить статистически уловимые аномалии. Да, разумеется, при серьёзном языковом исследовании лингвист наверняка сумеет отделить зёрна от плевел, но, вот увидите, плевелы тоже весьма интересные попадаются.

Сразу оговорюсь. Не все найденные аномалии ведут происхождения от FineReader’а, хотя ко многим он приложил руку. Итак, начнём.
Читать дальше →

Учим iPhone извлекать адреса-пароли-явки из печатных материалов

Время на прочтение2 мин
Охват и читатели5.3K
image Многие из вас наверняка слышали про ABBYY Business Card Reader — программу, которая позволяет быстро создать контакт, считав информацию с визитной карточки. А что если вам не нужно сохранять контакт? Что если вам просто нужно зайти на веб-страницу, адрес которой указан на большом билборде, или, допустим, позвонить по телефону горячей линии, указанному на обратной стороне вашей кредитной карточки?

Вручную вводить данные не хочется, а пользоваться в подобных случаях программой BCR не особо удобно – она для другого придумана, поэтому наши ребята из мобильного департамента специально для таких жизненных ситуаций разработали небольшую обойму из трех приложений для iPhone под общим названием ABBYY Mobile OCR Utilities. Среди них ABBYY MailGrabber, ABBYY PhoneGrabber и ABBYY LinkGrabber.

Как это работает?
Читать дальше →

Словари ABBYY Lingvo в электронных книгах

Время на прочтение2 мин
Охват и читатели39K
image
Все мы уже привыкли к электронным словарям в домашних компьютерах, ноутбуках, КПК и телефонах. Где-то они появились несколько десятилетий назад, где-то несколько лет. А вам не кажется, что в этом списке чего-то не хватает? Согласитесь, как-то странно, читая электронную книгу, лезть за бумажным словарем и искать перевод незнакомого слова — пропадает мобильность, а вместе с ней и весь смысл электронной читалки. А ведь многие люди сегодня стремятся получать информацию на любых языках: охотно знакомятся с другими культурами, интересуются техническими новинками и оригиналами литературных шедевров разных стран.

Решив, что с этим надо что-то делать, компании ABBYY и PocketBook объединили свои усилия по выпуску электронных книг со встроенными словарями ABBYY Lingvo. На первом этапе этого сотрудничества был выпущен PocketBook 360 ABBYY Lingvo для российского и украинского рынков. Поколение устройств PocketBook, в которое входила модель 360, работало на Linux, и мы адаптировали наши лингвистические технологии под эту платформу. За первое полугодие 2010 года было продано порядка 4 тысяч «читалок» с нашими словарями. Этот опыт и нам, и компании PocketBook показался удачным, поэтому мы решили не останавливаться на достигнутом :)
Читать дальше →

История ABBYY Lingvo. Три-ноль

Время на прочтение1 мин
Охват и читатели13K
image
Помнится, мы начали наши лингво-раскопки рассказом про нашего Бобра. Сегодня настало время углубиться аж в 1991 год! И вот что мы с вами там обнаружим, друзья. Это не что иное как ABBYY Lingvo 3.0 — самая ранняя версия Lingvo, которую мы смогли найти. Эти дискеты приятно даже просто в руках подержать. Но удастся ли их прочитать? Пятидюймовые дисководы сегодня на дороге не валяются.
Читать дальше →

Казнить нельзя помиловать

Время на прочтение3 мин
Охват и читатели13K
Пару лет назад я прочитал замечательную книгу Линн Трасс (Lynne Truss) о пунктуации «Eats, Shoots & Leaves» (в русском переводе «Казнить нельзя помиловать»). Автор увлечённо рассказывает о роли знакомых нам знаков препинания, прежде всего, в английском языке. Дополнить этот рассказ исключительно русскими реалиями могут многие люди, но в моём распоряжении есть кладезь всемирной мудрости – копилка эвристик системы распознавания. Поэтому у меня есть возможность рассказать подробнее о мировых традициях постановки знаков препинания. Может быть, кому-то это будет любопытно.
Читать дальше →

PDF с точки зрения программиста

Время на прочтение8 мин
Охват и читатели88K
Я имею дело с PDF не только как пользователь, а, прежде всего, как разработчик софта, умеющего его читать и писать (возможно, вы сталкивались с продуктами компании ABBYY, работающими с PDF – ABBYY FineReader, ABBYY PDF Transformer). Я предполагаю, что вы прочитали статью habrahabr.ru/company/abbyy/blog/105006 и далее пишу только про некоторые особенности и ограничения PDF, которые больше интересны продвинутым пользователям. Никаких сложных технических деталей при этом не буду касаться, так что программистам, желающим научиться читать или писать PDF, лучше сразу перейти к чтению спецификацию версии 1.7 со страницы www.adobe.com/devnet/pdf/pdf_reference_archive.html :)
Читать дальше →

One Definition Rule, inline и неожиданные последствия их сочетания

Время на прочтение4 мин
Охват и читатели14K
C++ требует, чтобы любая функция была определена не более одного раза – One Definition Rule, ODR. Как только вы определяете функцию с одним и тем же именем и сигнатурой в разных единицах трансляции (файлах .cpp), вы получаете индикацию ошибки на этапе линковки.

inline функции обычно определяются в заголовочных файлах (.h), чтобы все единицы трансляции могли видеть реализацию функции и подставить ее по месту вызова. Соответственно, как только вы включите заголовочный файл с такой функцией в более чем одну единицу трансляции, ODR будет формально нарушено, но… никакой индикации ошибки вы не получите.

Почему и какие неожиданные последствия это может иметь?
Читать дальше →

Lingvo со вкусом яблок

Время на прочтение3 мин
Охват и читатели12K
imageСвершилось то, о чем вы так долго просили. Встречайте ABBYY Lingvo для мобильных устройств Apple! Это не просто портированная под iOS версия мобильных словарей, которые до этого момента были доступны на WinMobile и Symbian, это продукт, созданный с учетом различных особенностей яблочной платформы. Сегодня мы запускаем версию для iPhone и iPod Touch (для iPhone OS 3.0 и выше), а версия для iPad появится через две недели.

Читать дальше →

Лингволоджи. Кунсткамера

Время на прочтение1 мин
Охват и читатели17K
Поскольку среда — это маленькая пятница (тем более, на этой неделе), представляем вашему вниманию выпуск увлекательного археолого-лексикографического журнала «Лингволоджи», который делает команда Lingvo. Сегодня мы поговорим о действительно странных штуках, населяющих словарь ABBYY Lingvo.

1. Спасибо, Кэп!

image

2. Несомненно, очень нужные в хозяйстве вещи

image

image

Читать дальше →

Информация

В рейтинге
3 376-й
Откуда
Россия
Работает в
Зарегистрирован
Активность