Как стать автором
Обновить

Ученые компании Smart Engines окончательно решили задачу распознавания паспорта РФ

Время на прочтение 3 мин
Количество просмотров 3.2K
Блог компании Smart Engines Разработка мобильных приложений *Обработка изображений *Машинное обучение *Искусственный интеллект

Научная компания Smart Engines решила последнюю фундаментальную проблему при распознавании паспорта РФ с помощью технологий искусственного интеллекта (ИИ). В программном продукте Smart ID Engine продемонстрирован режим распознавания «книжки» паспорта под разными углами и различном освещении в реальном времени в видеопотоке и на фотографиях. Именно «книжка» была тем научно-технологическим рубежом, преодолев который, задачу распознавания паспорта РФ на уровне ИИ можно считать решенной.

Читать далее
Всего голосов 17: ↑8 и ↓9 -1
Комментарии 15

Добрый вечер, здравствуйте

Время на прочтение 2 мин
Количество просмотров 2.5K
Блог компании Content AI Машинное обучение *Разработка под Linux *Разработка под Windows *Искусственный интеллект

Если вы программист, тестировщик или другой обитатель мира IT, то, возможно, ранее вы следили за деятельностью компании ABBYY, ведущего мирового разработчика решений в области интеллектуальной обработки информации и анализа бизнес-процессов. Весной 2022 года ABBYY приняла решение уйти из России, а мы — команда разработки и менеджмента бывшего российского офиса ABBYY — создали новую компанию Content AI. Мы посчитали важным сохранить многолетний архив этого блога, ведь в нем отражается путь не только одной компании, но и всей сферы AI российского IT.

И мы начинаем новую главу этой истории. 

Читать далее
Всего голосов 23: ↑17 и ↓6 +11
Комментарии 6

Платформа Финуслуги внедряет технологию проверки документов Smart Engines

Время на прочтение 2 мин
Количество просмотров 410
Блог компании Smart Engines Алгоритмы *Искусственный интеллект Финансы в IT IT-компании

Платформа личных финансов Финуслуги Московской биржи внедрила систему распознавания паспортов, разработанную российской AI-компанией Smart Engines.

Система Smart Engines распознает данные паспортов в неидеальных условиях, например: блики, недостаточное освещение, расположение документа под углом или в виде “книжечки”. Решение считывает основной разворот паспорта за 0,15 сек. и способно определять признаки подделки документов на фотокопиях документов для целей физической идентификации клиента на Финуслугах.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

reCAPTCHA: дополнительная польза от борьбы со спамом.

Время на прочтение 1 мин
Количество просмотров 2.4K
Разработка веб-сайтов *
Сотрудники Carnegie Mellon University подсчитали, что ежедневно по всему миру люди заполняют 60 миллионов каптч. Приняв время заполнения каптчи за 10 секунд, получаем более 160 000 человекочасов (или около 19-ти ЛЕТ!) за день.
И они решили попытаться хотя бы малую часть пропадающих зазря усилий направить на полезное дело, а именно — на распознавание книг.
Суть их идеи такова: на реКАПТЧЕ даются ДВА идущих подряд слова из книги, одно из которых система распознания текста не осилила. реКАПТЧА проверяет известное слово, а вариант распознания неизвестного добавляет в свою базу. Оба этих слова задисторчены обыкновенными и специальными каптча-фильтрами, чтобы пользователь не схалявил, предложив вариант «упячка», к примеру.
Демо и подробности тут:


Университет предлагает готовые решения для форумов/блогов/почты. ИМХО если технология найдет свое применение, вебдваноль наконец сотворит что-то действительно полезное.
Всего голосов 54: ↑51 и ↓3 +48
Комментарии 58

OCR из Google

Время на прочтение 1 мин
Количество просмотров 968
Чулан
Google ведёт разработку собственной OCR-системы под названием OCRopus.
В данный момент разработка ведётся для Linux x86 и x86/64 под дистрибутивом Ubuntu 6.10. Как сообщают разработчики, код легко портируется для поддержки других дистрибутивов и платформ.
План разработки:
  • Альфа релиз (3 четверть 2007)
  • Бета релиз (1 четверть 2008)
  • Версия 1.0 (3 четверть 2008)


Исходный код: ocropus.googlecode.com (Subversion)
Источник: googleblog.blogspot.com
Всего голосов 8: ↑7 и ↓1 +6
Комментарии 4

FineReader 9.0: новый революционный размягчитель твердых копий

Время на прочтение 1 мин
Количество просмотров 613
Софт
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Рейтинг 0
Комментарии 0

FineReader 9.0: новый революционный размягчитель твердых копий

Время на прочтение 5 мин
Количество просмотров 996
Чулан
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Всего голосов 43: ↑37 и ↓6 +31
Комментарии 167

Scribd бесплатно отсканирует ваши документы

Время на прочтение 1 мин
Количество просмотров 757
Чулан
Стартап Scribd, который специализируется на публикации документов через флэш-виджеты, вчера объявил о старте беспрецедентной программы Scribd iPaper. Чтобы привлечь на свой хостинг побольше файлов, они решили делать бесплатное сканирование и OCR всех документов и книг, которые пришлют им по почте. Это действительно уникальное предложение, потому что у нас цены на сканирование и распознавание текстов начинаются примерно от $0,17 за страницу, а здесь всё бесплатно.


Читать дальше →
Всего голосов 24: ↑23 и ↓1 +22
Комментарии 26

Google подключил OCR-движок для индексации PDF

Время на прочтение 1 мин
Количество просмотров 1.1K
Поисковые технологии *
Google сделал значительный шаг на пути к индексированию так называемой Невидимой сети, то есть той львиной части сетевого контента, которая до сих пор не поддаётся роботам поисковых систем. Это, в основном, запароленые сайты и различные базы данных, а также огромные массивы отсканированных документов в формате PDF.

И Google, и многие другие поисковики без проблем индексируют PDF, если в нём есть текстовый слой (он хранится в стандартном текстовом формате в контейнере файла). Но подобных «правильных» PDF на самом деле довольно мало. Гораздо больше документов представляют собой обычные отсканированные копии в графическом формате, просто сохранённые в PDF. Поэтому для их индексации Google сейчас подключил OCR-движок. Теперь в индекс попадут миллионы недоступных ранее государственных отчётов, судебных решений и академических исследований. Вот некоторые примеры работы нового движка.

Нужно напомнить, что в апреле Google научился обрабатывать выпадающие меню и другие HTML-формы в различных интерфейсах баз данных, это тоже важная технология по индексации Невидимой сети.
Всего голосов 53: ↑51 и ↓2 +49
Комментарии 32

OCR и нейронная сеть на Javascript

Время на прочтение 1 мин
Количество просмотров 7.1K
JavaScript *
Некий Shaun Friedle написал любопытный javascript который автоматизирует распознавание captcha на megaupload.

Пара любопытных особенностей скрипта:
  1. используется HTML 5 функция javascript getImageData для работы с пикселями;
  2. используется искусственная нейронная сеть для распознавания и работает довольно точно.

Пример работы: herecomethelizards.co.uk/mu_captcha
Исходник: userscripts.org/scripts/review/38736
Всего голосов 74: ↑74 и ↓0 +74
Комментарии 50

Каптчи. Способы взлома и защиты

Время на прочтение 3 мин
Количество просмотров 3.9K
Информационная безопасность *
Кросс-пост из нашего блога, посвященному компьютерной безопасности

Ранее мы писали о уязвимостях каптч на сайтах компании Киевстар и Билайн. Теперь мы хотим, вашему вниманию предоставить наше исследование в области взломов и защиты каптч.
Читать дальше
Всего голосов 28: ↑16 и ↓12 +4
Комментарии 12

Инфракрасная подсветка для OCR

Время на прочтение 1 мин
Количество просмотров 1.6K
IT-компании
Как известно, Google поставила перед собой отсканировать, распознать и проиндексировать все бумажные книги в мире, то есть всё знание человечества. Однако в реальности этот процесс продвигается не так быстро, как хотелось бы. Самый трудный этап — нормальное распознавание текста. Для программы OCR нужно чёткое изображение страницы без искажений. Все строчки на странице должны быть идеально ровными. На практике же книгу невозможно прижать к сканеру (во многих случаях страницы книги вообще нельзя трогать). Как бы то ни было, возникают характерные искривления по краям страниц. С ними борются программными методами, с разной степенью успешности.

Однако, компания Google придумала, как можно аппаратным способом помочь в решении этой проблемы. На прошлой неделе они получили патент на применение инфракрасных сенсоров при сканировании книг (патент США № 7508978). Суть идеи в том, что инфракрасная сетка позволяет составить трёхмерную модель искривления страницы, так что программа для выравнивания изображения получает чёткие координаты, как нужно преобразовать картинку.



New Scientist
Всего голосов 36: ↑34 и ↓2 +32
Комментарии 34

Демо-версия Google Docs OCR

Время на прочтение 1 мин
Количество просмотров 2.6K
IT-компании
Как сообщалось вчера, для Google Docs API начали тестировать новую фичу распознавания текстов, как в Evernote. То есть станет возможным просто сфотографировать или отсканировать документ, загрузить картинку в Google Docs — и документ появится там в виде нормального текста

Для активации OCR при загрузке документов через API нужно добавить параметр ocr=true.

В онлайне появилась работающая демо-версия (исходники будут позже). Поддерживаются файлы JPG, GIF и PNG размером до 10 МБ. Распознавание одной страницы текста занимает до 40 секунд (сегодня, очевидно, будет и дольше). Сервис работает с глюками, возможны ошибки.
Читать дальше →
Всего голосов 35: ↑29 и ↓6 +23
Комментарии 22

OCR online

Время на прочтение 3 мин
Количество просмотров 5.2K
Я пиарюсь
С технологией оптического распознавания текста я познакомился где-то в 1997 года, когда купил свой первый, тогде ещё ручной, чёрно-белый сканер Genius ScanMate 256 (кстати, всё ещё рабочий). К сканеру прилагалась программа Direct OCR на 3х дюймовой дискете (блин, откуда-то из подсознания все эти названия всплывают), которая всеми своими силами пыталась доказать, что можно быстро и почти без ошибок текст из книги ввести в компьютер. Ну, доказательства были не очень. FineReader, с которым я познакомился позже, делал это качественнее. Тема распознавания меня заинтересовала, я потратил довольно много времени на научно-популярные статьи о технологиях OCR.

В 2001 году я готовил дипломную работу по web-технологиям. Долго думал о том, куда приложить знания. Поскольку меня интересовала технология OCR, я задумал совместить WEB и распознавание текстов. За само распознавание у меня должен был отвечать FineReader. С друзьями мы «разобрали» FineReader на отдельные DLL и выяснили, как вызывать отдельные функции этих библиотек, передавая двоичные данные изображений, и как получать обратно распознанный вариант текста. Над этим всем был построен простейший веб-интерфейс, чтобы загружать картинки, запускать распознавание и получать результат.
Читать дальше →
Всего голосов 48: ↑45 и ↓3 +42
Комментарии 31

Фотокамеры телефонов Nokia будут переводить слова

Время на прочтение 1 мин
Количество просмотров 776
Компьютерное железо
Перевод
image

По фотографии, думаю, и так все понятно. Nokia занимается над созданием OCR для камер в своих телефонах. Понятно, что технология будет актуальна в камерах с большим количеством пикселей — примерно 8-12 Мп. Думаю, что технология будет востребована, например, туристами.
Скажите, Вы удивлены новой технологией или это раньше где-то уже обсуждалось?
Всего голосов 56: ↑54 и ↓2 +52
Комментарии 48

Google Docs индексирует PDF

Время на прочтение 1 мин
Количество просмотров 1.6K
IT-компании
В Google Docs добавлена фича индексирования текста в PDF-документах, так что они теперь тоже доступны для полнотекстового поиска из интерфейса Docs. Текст индексируется по текстовому полю, в том числе на русском языке.



В будущем Google должен подключить также систему распознавания текста из графических изображений (OCR), которая уже используется базовым индексатором поисковой системы Google, а также доступна через Google Docs API в качестве эксперимента. Тогда станет возможным индексировать любые типы PDF, в том числе отсканированные документы. Правда, русский язык движком Google OCR пока не поддерживается.

via Google Operating System
Всего голосов 14: ↑9 и ↓5 +4
Комментарии 7

pytesser — OCR-библитека для языка Python (оптическое распознавание символов)

Время на прочтение 1 мин
Количество просмотров 12K
Чулан
Сегодня бродил по проектам на Google и наткнулся на довольно интересную разработку — pytesser. По утверждению разработчика распознать текст на изображении. Библиотека использует tesseract-ocr и PIL.
Читать дальше →
Всего голосов 13: ↑11 и ↓2 +9
Комментарии 6

Вышел FineReader 10!

Время на прочтение 3 мин
Количество просмотров 1.9K
Блог компании Content AI
Уже несколько месяцев как вышел, успел получить немало лестных отзывов и даже одну (надеемся, не последнюю) весьма важную награду. 4.5 звёзд из 5 от PCMagа, сами понимаете, за «Hello, world» не дают. Более того, ходят слухи, что столько не ставили ещё ни одному OCR! Так вот, мы, значит, стараемся-стараемся, а на Хабре ни слуху, ни духу: всё FineReader Online, да FineReader Online. Нехорошо. Давайте разберёмся,

Чего же ждать от FineReader 10?


Читать дальше →
Всего голосов 69: ↑53 и ↓16 +37
Комментарии 72

В Google Docs появилось OCR

Время на прочтение 1 мин
Количество просмотров 13K
IT-компании
На странице загрузки файлов в Google Docs теперь доступен параметр «Преобразовывать текст из PDF-файлов или изображений в формат Документов Google»:



Можно загрузить отскарированное изображение (JPEG, GIF, PNG) или PDF-файл, и Google Docs извлечёт текст и форматирование для редактирования.

В Google Docs Blog пишут, что система OCR разработана в сотрудничестве с командой Google Books. Распознавание лучше всего работает с изображениями в высоком разрешении, и не всё форматирование может быть сохранено. Для того, чтобы можно было проверить ошибки распознавания, в новый документ включается оригинал изображения. Пока что поддерживаются тексты только на английском, французском, итальянском, немецком и испанском языках.
Всего голосов 104: ↑99 и ↓5 +94
Комментарии 35

Как научить Windows Search искать информацию в картинках

Время на прочтение 2 мин
Количество просмотров 7.1K
Блог компании Content AI

Некоторое время назад мы уже писали об одном из вариантов использования ABBYY Recognition Server, сегодня расскажем вам ещё об одном. Все знают виляющую хвостом собаку, которая появляется в Windows XP при нажатии F3. За ней скрывается удобная поисковая служба Windows Search, позволяющая находить затерявшиеся на компьютере файлы по названиям, а иногда и по содержимому. Поиск по содержимому в Windows по умолчанию поддержан только для файлов текстовых форматов.

Недавно мы выпустили новый продукт ABBYY Recognition Server IFilter – специальное дополнение к Windows Search, которое помогает этому поисковому сервису индексировать файлы графических форматов – TIFF, JPEG, PDF и др., хранящиеся на компьютере, чтобы потом можно было легко находить их с помощью полнотекстового поиска. Для извлечения текста из документов-изображений задействуется ABBYY Recognition Server, установленный в корпоративной сети.

Читать дальше →
Всего голосов 37: ↑25 и ↓12 +13
Комментарии 28