Pull to refresh
  • by relevance
  • by date
  • by rating

Smart Engines представила новое поколение систем распознавания с аутентификацией документов и биометрической верификаций

Algorithms *Image processing *Machine learning *Artificial Intelligence

Smart Engines представила новое поколение систем распознавания паспортов, других удостоверений личности, банковских карт, баркодов и документов с возможностью аутентификации и биометрической верификации. Компания стала единым поставщиком технологий для точного, быстрого и безопасного извлечения данных, аутентификации документов с проверкой «живости» (document liveness detection) и признаков компрометации (computational document forensics), распознавания лиц (face matching) для верификации пользователей. Все продукты новой линейки: Smart ID Engine, Smart Code Engine и Smart Document Engine разработаны в соответствии с принципами ответственного ИИ и призваны вывести защиту пользователей и бизнеса от мошеннических действий с документами на принципиально новый уровень.

Читать далее
Rating 0
Views 597
Comments 0

Ученые компании Smart Engines окончательно решили задачу распознавания паспорта РФ

Smart Engines corporate blog Development of mobile applications *Image processing *Machine learning *Artificial Intelligence

Научная компания Smart Engines решила последнюю фундаментальную проблему при распознавании паспорта РФ с помощью технологий искусственного интеллекта (ИИ). В программном продукте Smart ID Engine продемонстрирован режим распознавания «книжки» паспорта под разными углами и различном освещении в реальном времени в видеопотоке и на фотографиях. Именно «книжка» была тем научно-технологическим рубежом, преодолев который, задачу распознавания паспорта РФ на уровне ИИ можно считать решенной.

Читать далее
Total votes 17: ↑8 and ↓9 -1
Views 2.4K
Comments 15

Китайцы вскрыли протокол Skype

Lumber room
Маленькая китайская компания объявила о том, что взломала протокол Skype. Теперь можно подключаться к сети Skype через альтернативное клиентское ПО, а также обнаруживать, распознавать и блокировать голосовой трафик.

Китайцы обещают выпустить клиентскую программу на рынок до конца августа 2006 г. Она будет избавлена некоторых недостатков оригинального клиента, например, будет потреблять меньше вычислительных ресурсов ПК и не будет поддерживать технологию «супер-нодов», с помощью которой компьютер любого пользователя может использоваться в качестве гейта для передачи трафика между компьютерами других пользователей. То есть китайский клиент Skype не будет «воровать» вычислительные ресурсы, как это делает оригинальный клиент. И уж тем более в нем не будет баннерной рекламы, о скором появлении которой уже заявили разработчики Skype.

О взломе проприетарного протокола Skype стало известно 13 июля 2006 г. Об этом сообщил в своем блоге Чарли Пэгли (Charlie Paglee), директор компании Vozin Communications, которая специализируется на услугах в области VoIP-коммуникаций и имеет подразделения в США и Китае. Он сказал, что ему позвонил «друг из одной китайской компании», причем звонок был осуществлен не из фирменной программы Skype, а из другой клиентской программы. Чарли также опубликовал ее скриншот.

Китайская компания, название которой не сообщается (известно только, что в ней работает 10 человек и что она получила венчурное финансирование), собирается усовершенствовать свою программу и выпустить на рынок. На данный момент в ней реализована только функция P2P-звонков, но в будущем разработчики планируют реализовать статусы присутствия, чат и другие функции, чтобы их программа была на 100% совместима с «родным» клиентом Skype. Судя по всему, китайская компания выпустит на рынок три отдельных компонента, с помощью которых можно будет создавать совместимые приложения.

Представители Skype отказываются комментировать «подвиги» китайских коллег. Во-первых, до сих пор не имеется доказательств, что проприетарный протокол Skype взломан — клиентская программа ведь еще не выпущена. Во-вторых, даже если компания Skype (точнее, ее нынешние владельцы — корпорация eBay) попытаются предпринять какие-то меры для юридического давления на китайских хакеров, то вряд ли эти меры смогут принести результат. Против китайских компания очень тяжело судиться, тем более что сама программа Skype запрещена в Китае. Возможно даже, что местные власти поощряют взлом закрытого протокола, потому что это позволяет быстро и надежно блокировать голосовой трафик в Сети. Кроме того, сам по себе протокол Skype не запатентован и его, вроде бы, не запрещено вскрывать. Если это правда, то к китайцам вообще не может быть никаких претензий.

По мнению экспертов, данный случай — это лишнее доказательство неправильной политики компании Skype, которая отказывается сделать свой коммуникационный протокол открытым и дать возможность независимым разработчикам создавать приложения, совместимые со Skype. Разумеется, на заранее обговоренных взаимовыгодных условиях. Если же протокол закрыт, то у некоторых появляется соблазн его взломать, и уже от этого Skype не получит абсолютно никакой выгоды.
Rating 0
Views 453
Comments 5

Распознавание подкастов

Self Promo
Недавно я начал запись подкастов и столкнулся вот с какой проблемой: поисковики не умеют индексировать голос и видео изображения, поэтому каждый подкаст необходимо снабжать текстовыми комментариями и описанием, которые проиндексируют поисковики. Очень хорошо для индексации было бы весь подкаст изложить в текстовом варианте.

Времени на такую работу обычно не бывает, а работа очень важная. Можно было бы сделать такой проект, в котором подкастеры будут заказывать «конвертацию» подкастов в текст, за что будут платить трансляторам денежки. В результате всем хорошо: подкастеры получаю нормальное индексирование, «трансляторы» (те кто слушают подкасты и набивают тексты) получают заработок.

UPD. Вопрос к комментаторам: как по вашему мнению, хватит ли денег, которые заплатят авторы подкастов за распознавание чтобы привлечь распознователей? а организаторам проекта что-нибудь останется?
Total votes 14: ↑9 and ↓5 +4
Views 841
Comments 19

Распознавание Лжи

Lumber room
Ещё в древности существовали методы для разоблачения лжецов. Так, например, в Древнем Китае подозреваемый должен был набрать горсть сухого риса в рот и выслушать обвинение. Если рис оставался сухим — значит обвиняемый врет, его слюноотделение приостановлено от страха разоблачения.

В настоящее время существует несколько разновидностей «детекторов лжи», основанных на измерениях пульса, потоотделения, слюноотделения и колебаний в голосе. Сначала человеку задается серия простых вопросов, на которые он должен отвечать правдиво — настройка детектора, затем переходят непосредственно к допросу. В случае, если человек врет, как правило, из-за пусть даже мельчайшего волнения и напряженности, перечисленные выше параметры будут отличаться от принятых за номинальные (в результате настройки). Конечно же, при помощи этих аппаратов абсолютно точно ответить на вопрос, лжет ли человек, всё-равно нельзя (например, есть специально натренированные люди, которые умеют «обманывать» детекторы).

Но в жизни, во время важных переговоров, как, впрочем, и в быту зачастую также необходимо знать, врет ли Ваш собеседник или нет и без использования детекторов. Хочу привести несколько советов исходя из собственного опыта, прочитанных книжек и просмотренных фильмов.
Читать дальше →
Total votes 34: ↑20 and ↓14 +6
Views 1K
Comments 30

Audiotag.info — новый сервис распознавания музыки

Self Promo


Александр Радзишевский, владелец небезызвестого ресурса www.websound.ru, на днях открыл сервис AudioTag, позволяющий узнать имя исполнителя и название композиции по небольшому фрагменту композиции — достаточно загрузить лишь 15-30 секундный отрывок (или композицию целиком).

В основе сервиса лежит сложный механизм распознавания аудио, объединяющий технологию аудио-отпечатков и большую базу аудио-музыкальную данных. Когда вы загружаете файл, специальный алгоритм преобразует его в так называемый «аудио-отпечаток», который и используется для поиска в базе данных. В результате такого распознавания обнаруживаются один или несколько треков-кандидатов, совпадающих с обработанным файлом с той или иной вероятностью.

— алгоритм скорее не распознАет трек, чем распознает его неверно
— алгоритм распознаёт треки с некоторой вероятностью
— в случае нахождения нескольких вариантов, результат сортируется по этой вероятности
— распознаются ускоренные и зашумлённые треки
— музыкальная база содержит более миллиона треков, в том числе немало русских
— интеграции с плеерами (пока?) нет, только онлайн
— денег не берут

Секреты алгоритма создания слепков и источника музыкальной базы автор не раскрывает. Однако, что касается первого — они уже существуют (хоть я и не понимаю как это чудо работает, но по форме это что-то вроде MD5), а по второму вопросу, возможно, были задействованы ресурсы какого-нибудь «знакомого» онлайн-магазина — всё-таки миллион треков это очень много, да и вряд ли Алекс держит в личном архиве столько попсы :)

Читать дальше →
Total votes 51: ↑45 and ↓6 +39
Views 34K
Comments 49

Разогнанный движок – ABBYY FineReader Engine 10 для Windows работает намного быстрее

ABBYY corporate blog ECM *
На прошлой неделе мы выпустили очередную версию OCR SDK – продукта для встраивания технологий распознавания текста в различные приложения. Уже в течение многих лет выпуск пользовательского коробочного FineReader’a мы дополняем тиражом кружек и маек выпуском соответствующих технологий в виде SDK – FineReader Engine (для краткости его зовем FRE).

Под катом я расскажу об улучшениях нового FRE по сравнению с предыдущими версиями.
Читать дальше →
Total votes 32: ↑28 and ↓4 +24
Views 14K
Comments 19

Ubuntu — Фейс-контроль для входа в систему

Configuring Linux *
На OMG! Ubuntu! привели простую инструкцию, как можно прикрутить изображение с камеры для входа в систему. Безопасность данной реализации ещё ожидает своего исследователя, тут же будет дан небольшой перевод заметки и комментарии.

Важно! Функция входа в систему пока что не работает в случае, если пользовательский каталог зашифрован.
Читать дальше →
Total votes 47: ↑40 and ↓7 +33
Views 4.8K
Comments 63

Чем занять процессоры?

ABBYY corporate blog
В науке футурологии одним из основных методов является анализ текущих инвестиций в определенные исследования. Футурология исходит из того, что в том, куда никто ничего не вкладывает, никаких фундаментальных изменений можно не предвидеть (хотя, конечно, могут быть неожиданные открытия, которые перепутают все карты, но научно предсказать их все равно невозможно). Соответственно, если куда-то кто-то вкладывается (например, известно, что огромные средства сейчас тратятся на прикладную генетику и микробиологию), то можно с некоторой вероятностью ожидать, что там что-то да получится. Дальше эти ученые идут и спрашивают людей, которые в этих областях что-то делают, какие цели те преследуют и в какие сроки, с их точки зрения, эти цели достижимы. А дальше делают поправку на оптимизм, подключают свое воображение и анализ, и достраивают картину мира, в которой есть то, что к тому времени уже сделали эти люди.

Предлагаю и нам на короткое время заняться любительской футурологией. Мы попытаемся ответить на простой вопрос: куда нас заведет гонка процессоров?

Читать дальше →
Total votes 14: ↑8 and ↓6 +2
Views 2.7K
Comments 14

Каждому студенту – по «хомяку»

ABBYY corporate blog
image
Пару недель назад вышла облегчённая версия ABBYY FineReader 10 – Home Edition (мы её ласково называем «хомяк»). «Домашняя» версия нашего любимого продукта создавалась на тех же технологиях, что и Professional Edition (возможно, вы уже читали о нём на Хабре), но в ней меньше функций. «Лёгкий» (читай: дешёвый) FineReader 10 уже давно ждала студенческая братия – наконец, дождалась :)

Что умеет этот зверь
Total votes 46: ↑37 and ↓9 +28
Views 12K
Comments 35

Вышла четвёртая версия ABBYY Business Card Reader for iPhone

ABBYY corporate blog
image
На днях мы выпустили новую, четвёртую версию ABBYY Business Card Reader для iPhone. Что появилось нового? Прежде всего, ABBYY BCR 4.0 научился распознавать корейский язык, и теперь в программе языков распознавания аж целых 20. Но главное новшество – это CardHolder, или «Визитница», – специальный архив для хранения фотографий визиток вместе с распознанными данными.
Читать дальше →
Total votes 26: ↑18 and ↓8 +10
Views 6.8K
Comments 12

Распознавание некоторых современных CAPTCHA

Python *Algorithms *Image processing *
Sandbox
Именно так называлась работа, представленная мной на Балтийском научно-инженерном конкурсе, и принёсшая мне очаровательную бумажку с римской единичкой, а также новенький ноутбук.

Работа заключалась в распознавании CAPTCHA, используемых крупными операторами сотовой связи в формах отправки SMS, и демонстрации недостаточной эффективности применяемого ими подхода. Чтобы не задевать ничью гордость, будем называть этих операторов иносказательно: красный, жёлтый, зелёный и синий.

Читать дальше →
Total votes 319: ↑313 and ↓6 +307
Views 75K
Comments 147

Методы распознавания отпечатков пальцев и реализация средствами Python

Information Security *
Sandbox
В текущем семестре появился в расписании предмет «Методы и средства защиты компьютерной информации», частью которого являются лабораторная работа по биометрии, а точнее по распознаванию отпечатка пальца. Так же, недавно, на Хабре была статья про устройства предназначенные для сканирования. Решил написать здесь про алгоритмы распознавания.
Читать дальше →
Total votes 118: ↑115 and ↓3 +112
Views 45K
Comments 20

Распознавание речи на собственном сайте: тестовый стенд распознавания Speereo

Speereo Software corporate blog
Здравствуйте хабравчане! Мы рады появиться на Хабре и надеемся, что мы здесь надолго и будем полезны как Вам, так и для себя извлечем пользу.

Итак, с трепетом к первому посту!

Проблема

Часто на веб-сайтах пользователям приходится заполнять формы запросов. Это могут быть названия железнодорожных станций или аэропортов в сервисе заказа билетов, названия улиц в поиске на карте, названия товаров или групп товаров в интернет-магазине, наконец, обычный поиск по сайту или форуму.
Во всех этих случаях происходит выбор из некоторого, заранее известного списка или индексированного набора слов/фраз.
Особенно неудобно вводить такие текстовые запросы, когда поиск осуществляется со смартфона. Иногда делать это настолько неудобно, что мы отказываемся от использования сервиса, решаем «сделаю попозже» и забываем.

Решение

Мы предлагаем альтернативное решение подобных проблем с помощью собственного «облачного» распознавания слитной речи, внедренного в Ваш сайт.
Читать дальше →
Total votes 11: ↑6 and ↓5 +1
Views 8.7K
Comments 13

Распознавание рукописных математических выражений

Algorithms *
Здравствуй, Хабр!

В этой статье я хочу поделиться опытом распознавания рукописных математических выражений. Хотя уже и существуют такие средства распознавания рукописных формул как «Панель математического ввода» mip.exe в Windows7, разнообразие подходов к решению данной проблемы не может не впечатлять. Об одном из таких подходов я и собираюсь рассказать.




Читать дальше →
Total votes 237: ↑232 and ↓5 +227
Views 18K
Comments 77

Google goggles научился распознавать кириллицу

IT-companies


Отныне приложение Google goggles, существующее в версиях для Android и iOS, может работать с изображениями, содержащими кириллический текст — об этом вчера появилась запись в официальном блоге этого продукта. Также сообщается о возможности сохранять историю поиска и возможности копировать распознанный текст в буфер смартфона с целью вставки в другие приложения.

Само приложение Goggles предназначено визуального поиска и распознавания изображений, полученных при помощи камеры мобильного устройства. Технически его работа выглядит следующим образом: снятое изображение (в последней версии достаточно просто навести камеру на интересующий объект) и информация о местоположении устройства передается на серверы Google, где картинка распознается, а результат используется для выполнения поиска.

Подробнее о работе сервиса на видео под катом.
Посмотреть
Total votes 51: ↑45 and ↓6 +39
Views 643
Comments 36

Написание макроса-бота для браузерной игры

Game development *

Введение


Не так давно на Google+ появились игры. Прочитав топик об этом, я решил во что нибудь поиграть. Выбор пал на игру Diamond Dash. Через некоторое время игры программист во мне заговорил, что однотипные действия нужно автоматизировать. И вот что из этого вышло…

*Примечание: «руками» даже опытному игроку сложно набрать больше 400к

Раньше я никогда не сталкивался с задачами работы с экраном и мышкой. После непродолжительного гугления было решено для решения использовать язык макросов AutoIt.
Под катом вы найдете краткое описание игры, мой способ распознавания поля, алгоритм определения точки нажатия, и некоторое количество оптимизаций. А так же ссылку на github-репозиторий скрипта.
UPD Добавлено видео работы скрипта.
Читать дальше →
Total votes 168: ↑164 and ↓4 +160
Views 49K
Comments 115

Из пыльного архива в Интернет: как ABBYY Recognition Server оцифровывает библиотеки

ABBYY corporate blog
Мы в своем блоге уже неоднократно писали о необычных применениях нашего ABBYY Recognition Server. И в комментариях нас регулярно спрашивали, почему мы не сотрудничаем с библиотеками. Мы, конечно, отвечали, что сотрудничаем, но подробно об этом не рассказывали. Сегодня мы исправляемся.

image Для начала небольшой экскурс в историю: с библиотеками мы работаем уже больше 10 лет. Одним из первых проектов в этом направлении была оцифровка каталога Национальной библиотеки Литвы. Сначала в течение года было отсканировано более трех миллионов (!) карточек, которые содержали информацию о названии книги, ее авторе, издательстве, годе издания и много прочей полезной информации. Напомним, библиотечная карточка выглядит примерно так, и распознать её не так-то просто.

Потом все они были распознаны, проверены операторами – и у библиотеки появился быстрый и удобный в использовании электронный каталог.

Но это было уже давно.
Читать дальше →
Total votes 29: ↑29 and ↓0 +29
Views 13K
Comments 14

Экспорт в ODT и распознавание старинных текстов теперь в онлайне

ABBYY corporate blog
imageВсем привет от команды разработчиков FineReader Online.
Когда в этом блоге писали про то, что ABBYY FineReader 11 стал ближе к пользователям линукса, потому что он умеет экспортировать в ODT, нас немножко обсмеяли в комментах. Да, наверное, вы были правы. Мы поняли свою ошибку и исправились — теперь получить из картинки качественно распознанный файл в формате ODT можно не перебираясь из Linux'а даже под виртуальную машину с виндой. Среди форматов экспорта FineReader Online есть так любимый многими пользователями свободного ПО Open Document Text.

Читать дальше →
Total votes 23: ↑21 and ↓2 +19
Views 4.1K
Comments 7

Иерархическая Темпоральная Память (НТМ) и алгоритмы ее самообучения

Artificial Intelligence
Translation
Привет всем Хабражителям, кто интересуется вопросами искусственного интеллекта! Всех с Прошедшими праздниками! Пора двигаться дальше.

В конце прошлого года я закончил перевод последней версии документа о «Hierarchical Temporal Memory» (HTM), который теперь можно найти рядом с оригиналом на сайте Numenta.com.

Что это такое и зачем оно все? Это последняя разработка весьма небезысвестного Джеффа Хокинса сотоварищи, моделирующая работу отдельных слоев коры головного мозга. Эта штуковина позволяет (если не накосячить все сделать правильно) выделять из входного потока данных сходные события, их последовательности, проводить их распознавание и предсказание. Всех, кого интересуют подробности, милости прошу под хабракат.

Читать дальше →
Total votes 86: ↑77 and ↓9 +68
Views 7.5K
Comments 39