Как стать автором
Обновить

Ученые компании Smart Engines окончательно решили задачу распознавания паспорта РФ

Время на прочтение 3 мин
Количество просмотров 3.3K
Блог компании Smart Engines Разработка мобильных приложений *Обработка изображений *Машинное обучение *Искусственный интеллект

Научная компания Smart Engines решила последнюю фундаментальную проблему при распознавании паспорта РФ с помощью технологий искусственного интеллекта (ИИ). В программном продукте Smart ID Engine продемонстрирован режим распознавания «книжки» паспорта под разными углами и различном освещении в реальном времени в видеопотоке и на фотографиях. Именно «книжка» была тем научно-технологическим рубежом, преодолев который, задачу распознавания паспорта РФ на уровне ИИ можно считать решенной.

Читать далее
Всего голосов 17: ↑8 и ↓9 -1
Комментарии 15

Добрый вечер, здравствуйте

Время на прочтение 2 мин
Количество просмотров 2.7K
Блог компании Content AI Машинное обучение *Разработка под Linux *Разработка под Windows *Искусственный интеллект

Если вы программист, тестировщик или другой обитатель мира IT, то, возможно, ранее вы следили за деятельностью компании ABBYY, ведущего мирового разработчика решений в области интеллектуальной обработки информации и анализа бизнес-процессов. Весной 2022 года ABBYY приняла решение уйти из России, а мы — команда разработки и менеджмента бывшего российского офиса ABBYY — создали новую компанию Content AI. Мы посчитали важным сохранить многолетний архив этого блога, ведь в нем отражается путь не только одной компании, но и всей сферы AI российского IT.

И мы начинаем новую главу этой истории. 

Читать далее
Всего голосов 23: ↑17 и ↓6 +11
Комментарии 6

Платформа Финуслуги внедряет технологию проверки документов Smart Engines

Время на прочтение 2 мин
Количество просмотров 485
Блог компании Smart Engines Алгоритмы *Искусственный интеллект Финансы в IT IT-компании

Платформа личных финансов Финуслуги Московской биржи внедрила систему распознавания паспортов, разработанную российской AI-компанией Smart Engines.

Система Smart Engines распознает данные паспортов в неидеальных условиях, например: блики, недостаточное освещение, расположение документа под углом или в виде “книжечки”. Решение считывает основной разворот паспорта за 0,15 сек. и способно определять признаки подделки документов на фотокопиях документов для целей физической идентификации клиента на Финуслугах.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Финтех-компания Jump.Finance начала использовать систему распознавания паспорта от Smart Engines

Время на прочтение 2 мин
Количество просмотров 425
Блог компании Smart Engines Алгоритмы *Обработка изображений *Софт Искусственный интеллект

Компания Jump.Finance, входящая в экосистему «Тинькофф Бизнеса», начала применять технологии распознавания паспорта Smart Engines в приложении Jump.Работа. Это значительно упростит процедуру идентификации внештатных сотрудников и обеспечит безопасность процесса обработки данных.

Читать далее
Рейтинг 0
Комментарии 0

ГК БорисХоф в 4 раза ускорила проведение сделок с AI-технологией Smart Engines

Время на прочтение 2 мин
Количество просмотров 720
Блог компании Smart Engines Обработка изображений *Машинное обучение *Искусственный интеллект

Российский автомобильный холдинг БорисХоф начал использовать технологию распознавания паспорта РФ Smart Engines. Внедрение отечественного ПО на основе искусственного интеллекта позволило в 4 раза быстрее проводить сделки по продаже автомобилей.

Читать далее
Всего голосов 8: ↑6 и ↓2 +4
Комментарии 2

Новое российское ПО ускорит проверку документов в 10 раз

Время на прочтение 4 мин
Количество просмотров 3.2K
Блог компании Smart Engines Обработка изображений *Машинное обучение *Искусственный интеллект

Новая ИТ-разработка российской компании Smart Engines позволит ускорить проверку документов в 10 раз. Программа на базе искусственного интеллекта подтвердит подлинность документов и выявит признаки фальсификации за доли секунды. ПО защитит от мошенников госкорпорации, бизнес и системообразующие банки. 

Читать далее
Всего голосов 11: ↑6 и ↓5 +1
Комментарии 21

reCAPTCHA: дополнительная польза от борьбы со спамом.

Время на прочтение 1 мин
Количество просмотров 2.4K
Разработка веб-сайтов *
Сотрудники Carnegie Mellon University подсчитали, что ежедневно по всему миру люди заполняют 60 миллионов каптч. Приняв время заполнения каптчи за 10 секунд, получаем более 160 000 человекочасов (или около 19-ти ЛЕТ!) за день.
И они решили попытаться хотя бы малую часть пропадающих зазря усилий направить на полезное дело, а именно — на распознавание книг.
Суть их идеи такова: на реКАПТЧЕ даются ДВА идущих подряд слова из книги, одно из которых система распознания текста не осилила. реКАПТЧА проверяет известное слово, а вариант распознания неизвестного добавляет в свою базу. Оба этих слова задисторчены обыкновенными и специальными каптча-фильтрами, чтобы пользователь не схалявил, предложив вариант «упячка», к примеру.
Демо и подробности тут:


Университет предлагает готовые решения для форумов/блогов/почты. ИМХО если технология найдет свое применение, вебдваноль наконец сотворит что-то действительно полезное.
Всего голосов 54: ↑51 и ↓3 +48
Комментарии 58

OCR из Google

Время на прочтение 1 мин
Количество просмотров 1K
Чулан
Google ведёт разработку собственной OCR-системы под названием OCRopus.
В данный момент разработка ведётся для Linux x86 и x86/64 под дистрибутивом Ubuntu 6.10. Как сообщают разработчики, код легко портируется для поддержки других дистрибутивов и платформ.
План разработки:
  • Альфа релиз (3 четверть 2007)
  • Бета релиз (1 четверть 2008)
  • Версия 1.0 (3 четверть 2008)


Исходный код: ocropus.googlecode.com (Subversion)
Источник: googleblog.blogspot.com
Всего голосов 8: ↑7 и ↓1 +6
Комментарии 4

FineReader 9.0: новый революционный размягчитель твердых копий

Время на прочтение 1 мин
Количество просмотров 635
Софт
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Рейтинг 0
Комментарии 0

FineReader 9.0: новый революционный размягчитель твердых копий

Время на прочтение 5 мин
Количество просмотров 1.1K
Чулан
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Всего голосов 43: ↑37 и ↓6 +31
Комментарии 167

Scribd бесплатно отсканирует ваши документы

Время на прочтение 1 мин
Количество просмотров 802
Чулан
Стартап Scribd, который специализируется на публикации документов через флэш-виджеты, вчера объявил о старте беспрецедентной программы Scribd iPaper. Чтобы привлечь на свой хостинг побольше файлов, они решили делать бесплатное сканирование и OCR всех документов и книг, которые пришлют им по почте. Это действительно уникальное предложение, потому что у нас цены на сканирование и распознавание текстов начинаются примерно от $0,17 за страницу, а здесь всё бесплатно.


Читать дальше →
Всего голосов 24: ↑23 и ↓1 +22
Комментарии 26

Google подключил OCR-движок для индексации PDF

Время на прочтение 1 мин
Количество просмотров 1.1K
Поисковые технологии *
Google сделал значительный шаг на пути к индексированию так называемой Невидимой сети, то есть той львиной части сетевого контента, которая до сих пор не поддаётся роботам поисковых систем. Это, в основном, запароленые сайты и различные базы данных, а также огромные массивы отсканированных документов в формате PDF.

И Google, и многие другие поисковики без проблем индексируют PDF, если в нём есть текстовый слой (он хранится в стандартном текстовом формате в контейнере файла). Но подобных «правильных» PDF на самом деле довольно мало. Гораздо больше документов представляют собой обычные отсканированные копии в графическом формате, просто сохранённые в PDF. Поэтому для их индексации Google сейчас подключил OCR-движок. Теперь в индекс попадут миллионы недоступных ранее государственных отчётов, судебных решений и академических исследований. Вот некоторые примеры работы нового движка.

Нужно напомнить, что в апреле Google научился обрабатывать выпадающие меню и другие HTML-формы в различных интерфейсах баз данных, это тоже важная технология по индексации Невидимой сети.
Всего голосов 53: ↑51 и ↓2 +49
Комментарии 32

OCR и нейронная сеть на Javascript

Время на прочтение 1 мин
Количество просмотров 7.2K
JavaScript *
Некий Shaun Friedle написал любопытный javascript который автоматизирует распознавание captcha на megaupload.

Пара любопытных особенностей скрипта:
  1. используется HTML 5 функция javascript getImageData для работы с пикселями;
  2. используется искусственная нейронная сеть для распознавания и работает довольно точно.

Пример работы: herecomethelizards.co.uk/mu_captcha
Исходник: userscripts.org/scripts/review/38736
Всего голосов 74: ↑74 и ↓0 +74
Комментарии 50

Каптчи. Способы взлома и защиты

Время на прочтение 3 мин
Количество просмотров 4K
Информационная безопасность *
Кросс-пост из нашего блога, посвященному компьютерной безопасности

Ранее мы писали о уязвимостях каптч на сайтах компании Киевстар и Билайн. Теперь мы хотим, вашему вниманию предоставить наше исследование в области взломов и защиты каптч.
Читать дальше
Всего голосов 28: ↑16 и ↓12 +4
Комментарии 12

Инфракрасная подсветка для OCR

Время на прочтение 1 мин
Количество просмотров 1.6K
IT-компании
Как известно, Google поставила перед собой отсканировать, распознать и проиндексировать все бумажные книги в мире, то есть всё знание человечества. Однако в реальности этот процесс продвигается не так быстро, как хотелось бы. Самый трудный этап — нормальное распознавание текста. Для программы OCR нужно чёткое изображение страницы без искажений. Все строчки на странице должны быть идеально ровными. На практике же книгу невозможно прижать к сканеру (во многих случаях страницы книги вообще нельзя трогать). Как бы то ни было, возникают характерные искривления по краям страниц. С ними борются программными методами, с разной степенью успешности.

Однако, компания Google придумала, как можно аппаратным способом помочь в решении этой проблемы. На прошлой неделе они получили патент на применение инфракрасных сенсоров при сканировании книг (патент США № 7508978). Суть идеи в том, что инфракрасная сетка позволяет составить трёхмерную модель искривления страницы, так что программа для выравнивания изображения получает чёткие координаты, как нужно преобразовать картинку.



New Scientist
Всего голосов 36: ↑34 и ↓2 +32
Комментарии 34

Демо-версия Google Docs OCR

Время на прочтение 1 мин
Количество просмотров 2.7K
IT-компании
Как сообщалось вчера, для Google Docs API начали тестировать новую фичу распознавания текстов, как в Evernote. То есть станет возможным просто сфотографировать или отсканировать документ, загрузить картинку в Google Docs — и документ появится там в виде нормального текста

Для активации OCR при загрузке документов через API нужно добавить параметр ocr=true.

В онлайне появилась работающая демо-версия (исходники будут позже). Поддерживаются файлы JPG, GIF и PNG размером до 10 МБ. Распознавание одной страницы текста занимает до 40 секунд (сегодня, очевидно, будет и дольше). Сервис работает с глюками, возможны ошибки.
Читать дальше →
Всего голосов 35: ↑29 и ↓6 +23
Комментарии 22

OCR online

Время на прочтение 3 мин
Количество просмотров 5.3K
Я пиарюсь
С технологией оптического распознавания текста я познакомился где-то в 1997 года, когда купил свой первый, тогде ещё ручной, чёрно-белый сканер Genius ScanMate 256 (кстати, всё ещё рабочий). К сканеру прилагалась программа Direct OCR на 3х дюймовой дискете (блин, откуда-то из подсознания все эти названия всплывают), которая всеми своими силами пыталась доказать, что можно быстро и почти без ошибок текст из книги ввести в компьютер. Ну, доказательства были не очень. FineReader, с которым я познакомился позже, делал это качественнее. Тема распознавания меня заинтересовала, я потратил довольно много времени на научно-популярные статьи о технологиях OCR.

В 2001 году я готовил дипломную работу по web-технологиям. Долго думал о том, куда приложить знания. Поскольку меня интересовала технология OCR, я задумал совместить WEB и распознавание текстов. За само распознавание у меня должен был отвечать FineReader. С друзьями мы «разобрали» FineReader на отдельные DLL и выяснили, как вызывать отдельные функции этих библиотек, передавая двоичные данные изображений, и как получать обратно распознанный вариант текста. Над этим всем был построен простейший веб-интерфейс, чтобы загружать картинки, запускать распознавание и получать результат.
Читать дальше →
Всего голосов 48: ↑45 и ↓3 +42
Комментарии 31

Фотокамеры телефонов Nokia будут переводить слова

Время на прочтение 1 мин
Количество просмотров 799
Компьютерное железо
Перевод
image

По фотографии, думаю, и так все понятно. Nokia занимается над созданием OCR для камер в своих телефонах. Понятно, что технология будет актуальна в камерах с большим количеством пикселей — примерно 8-12 Мп. Думаю, что технология будет востребована, например, туристами.
Скажите, Вы удивлены новой технологией или это раньше где-то уже обсуждалось?
Всего голосов 56: ↑54 и ↓2 +52
Комментарии 48

Google Docs индексирует PDF

Время на прочтение 1 мин
Количество просмотров 1.6K
IT-компании
В Google Docs добавлена фича индексирования текста в PDF-документах, так что они теперь тоже доступны для полнотекстового поиска из интерфейса Docs. Текст индексируется по текстовому полю, в том числе на русском языке.



В будущем Google должен подключить также систему распознавания текста из графических изображений (OCR), которая уже используется базовым индексатором поисковой системы Google, а также доступна через Google Docs API в качестве эксперимента. Тогда станет возможным индексировать любые типы PDF, в том числе отсканированные документы. Правда, русский язык движком Google OCR пока не поддерживается.

via Google Operating System
Всего голосов 14: ↑9 и ↓5 +4
Комментарии 7

pytesser — OCR-библитека для языка Python (оптическое распознавание символов)

Время на прочтение 1 мин
Количество просмотров 12K
Чулан
Сегодня бродил по проектам на Google и наткнулся на довольно интересную разработку — pytesser. По утверждению разработчика распознать текст на изображении. Библиотека использует tesseract-ocr и PIL.
Читать дальше →
Всего голосов 13: ↑11 и ↓2 +9
Комментарии 6