Pull to refresh
  • by relevance
  • by date
  • by rating

Amr Eladawy пожаловался, что он не может бронировать билеты на самолеты из-за имени. Ему объяснили, почему

Abnormal programming *IT Infrastructure *IT Standards *Transport
imageФото: www.fastbooking.com

Один из пользователей по имени Амр Эладави (Amr Eladawy) рассказал о сложностях, которые возникают у него при попытке забронировать билет на самолет. По словам мужчины, система не способна корректно отобразить его имя.

Пользователь поведал, что при заказе авиабилета, когда агент передает данные авиакомпании, его имя в системе отображается просто как литера А. Он пояснил, что проблема возникала неоднократно, с разными агентами и различными авиаперевозчиками.

Когда же мужчина сам бронирует билет на сайте авиакомпании, то на билете его имя отображается как ELADAWY/AMRMR.
Читать дальше →
Total votes 76: ↑41 and ↓35 +6
Views 13K
Comments 17

«Яндекс» научила камеру распознавать еду, машины и уравнения

Artificial Intelligence IT-companies

Компания «Яндекс» выпустила масштабное обновление умной камеры, благодаря которой нейросеть научилась распознавать марку автомобилей, определять количество белков, жиров и углеводов в чипсах и решать уравнения. Об этом редакции «Хабра» рассказали в пресс-центре компании.

Читать далее
Total votes 13: ↑13 and ↓0 +13
Views 745
Comments 0

Evernote в России: Слон доехал

Evernote corporate blog
Сегодня наша команда официально запустила сервис Evernote на русском языке — www.evernote.com!

image

Не буду скрывать, мы внимательно отслеживали все упоминания о нашем детище на Хабрахабре, и рады, что многие уже успели оценить возможности «слона», хотя еще и на английском языке. Но поскольку развивался Evernote до последнего времени преимущественно в США, и в Рунете о нем пока знают немногие, имеет смысл рассказать подробнее. Рассказ и видео под катом.

Читать дальше →
Total votes 98: ↑93 and ↓5 +88
Views 11K
Comments 150

Инфракрасная подсветка для OCR

IT-companies
Как известно, Google поставила перед собой отсканировать, распознать и проиндексировать все бумажные книги в мире, то есть всё знание человечества. Однако в реальности этот процесс продвигается не так быстро, как хотелось бы. Самый трудный этап — нормальное распознавание текста. Для программы OCR нужно чёткое изображение страницы без искажений. Все строчки на странице должны быть идеально ровными. На практике же книгу невозможно прижать к сканеру (во многих случаях страницы книги вообще нельзя трогать). Как бы то ни было, возникают характерные искривления по краям страниц. С ними борются программными методами, с разной степенью успешности.

Однако, компания Google придумала, как можно аппаратным способом помочь в решении этой проблемы. На прошлой неделе они получили патент на применение инфракрасных сенсоров при сканировании книг (патент США № 7508978). Суть идеи в том, что инфракрасная сетка позволяет составить трёхмерную модель искривления страницы, так что программа для выравнивания изображения получает чёткие координаты, как нужно преобразовать картинку.



New Scientist
Total votes 36: ↑34 and ↓2 +32
Views 763
Comments 34

Переиндексация изображений для русских аккаунтов

Evernote corporate blog


Мы уже упоминали о том, что Evernote кое в чём выгодно отличается от человеческой памяти. Последняя с возрастом ухудшается, в то время как Evernote со временем учится «вспоминать» заметки все лучше и лучше за счет расширения функциональности поиска и появления других возможностей. Недавно этот тезис получил еще одно подтверждение: мы завершили переиндексацию текста в изображениях в старых заметках пользователей русскоязычной версии Evernote.

Вскоре после запуска локализованной версии в апреле некоторые пользователи жаловались на то, что на фотографиях и сканах, добавленных до официальной русификации, по-прежнему распознавался только английский текст. Сейчас это неудобство при поиске старых заметок с картинками разрешилось.

Теперь текст распознается во всех изображениях, которые были загружены до 1 мая 2009 года в аккаунты, созданные до 2 апреля 2009 (дата запуска русской версии). Всего было заново распознано около 50 000 изображений.
Total votes 35: ↑29 and ↓6 +23
Views 1.1K
Comments 6

Закладка для незрячих

Design
image

До сих пор все известные мне концепты книг для слепых представляли собой по большому счету специальное переиздание, в котором либо страницы отображаются шрифтом Брайля, либо текст озвучивается голосом. В общем, если считать книгу устройством, то дизайнеры всегда стремились создавать устройства новые. А вот команда китайцев в лице David Lee, Yuna Kim и Hansub Lee предложила нового ничего не изобретать, а модернизировать старое. В их концепте Haptic Reader книга остается набранной обычным шрифтом для зрячих. Новое – это только полупрозрачная закладка-сканер: кладешь ее на страницу и на гаджете появляются пупырышки Брайля.
Читать дальше →
Total votes 49: ↑48 and ↓1 +47
Views 334
Comments 31

Демо-версия Google Docs OCR

IT-companies
Как сообщалось вчера, для Google Docs API начали тестировать новую фичу распознавания текстов, как в Evernote. То есть станет возможным просто сфотографировать или отсканировать документ, загрузить картинку в Google Docs — и документ появится там в виде нормального текста

Для активации OCR при загрузке документов через API нужно добавить параметр ocr=true.

В онлайне появилась работающая демо-версия (исходники будут позже). Поддерживаются файлы JPG, GIF и PNG размером до 10 МБ. Распознавание одной страницы текста занимает до 40 секунд (сегодня, очевидно, будет и дольше). Сервис работает с глюками, возможны ошибки.
Читать дальше →
Total votes 35: ↑29 and ↓6 +23
Views 1.6K
Comments 22

Распознаем текст, используя расстояние Хэмминга

Artificial Intelligence
На данную статью меня натолкнула статья Alex’а Поветкина — «Распознавание образов методом потенциальных функций»

Итак, мы собираемся написать программу на Delphi (я использую версию 6), способную перевести символы с картинки в текст. Задача довольно популярная в интернете, и на каждый пост «Хочу реализовать распознавание символов!!! Помогите» самые частые ответы «почитай в интернете» либо «не берись, используй файнридер» и тому подобное.

Я, как и многие другие, начал с изучения основных алгоритмов. Конечно, такие монстры как FineReader тратят на алгоритмическую составляющую огромные деньги, и их секретов нам не узнать, но прочей информации было найдено приличное количество, чтобы понять основные методы. Но начнем издалека.
Читать дальше →
Total votes 100: ↑91 and ↓9 +82
Views 24K
Comments 34

Первая стабильная версия OCR-системы Cuneiform Linux

Open source *
Юсси Пакканен сообщил о выходе версии 1.0 системы оптического распознавания текстов Cuneiform Linux. В новой версии удалён некоторый код сомнительного лицензионного происхождения и исправлено множество ошибок.

Код Cuneiform Linux распространяется под упрощённой лицензией BSD и основан на коде системы CuneiForm, который был открыт компанией Cognitive Technologies в 2008 году.

Скачать можно здесь: launchpad.net/cuneiform-linux/+download (инструкции по установке и использованию можно прочитать в топике «Распознаем текст с помощью cuneiform»).
Total votes 53: ↑47 and ↓6 +41
Views 2.8K
Comments 14

KBookOCR for Linux. Убийца FineReader-а для Linux на начальной стадии

Configuring Linux *

Вступление


Возможно каждый из нас переживал период в своей жизни который сопровождался активно оцифровкой аналогов материала. Я имею в виду необходимость работы с текстом из неоцифрованных источников. Имеется в виду не только проблема сканирования, но и так же множество материала который к сожалению доходит до конечного потребитель не совсем в пригодном для использования виде. И я думаю у каждого из нас очень часто в голове пробегали лестные мысли об распространителя книги в формате djvu или pdf в котором весь контент был представлен сугубо графически без возможности использование материалов для своей деятельности.
Читать дальше →
Total votes 99: ↑71 and ↓28 +43
Views 21K
Comments 85

Простая система оптического распознавания символов для .NET

.NET *
Sandbox
Все началось с необходимости в одном из приложений получать снимок произвольного окна и 3-4 раза в секунду распознавать несколько областей изображения с заранее известными символами. Сделать скриншот окна с помощью WinAPI проблем не составило, а вот над распознаванием пришлось немного потрудиться.
Читать дальше →
Total votes 44: ↑33 and ↓11 +22
Views 17K
Comments 23

Быстрая маркировка изображений с использованием внешних контуров

Image processing *
В статье расскажу как достаточно быстро перечислить связные объекты на бинарном растре. Этот алгоритм мы использовали для распознавания изображений и текстов; он отличается от подобных высокой скоростью обработки (на картинках до 3200x2400, с некоторыми оговорками, он отрабатывает за миллисекунды) и доступностью в понимании (при наличии некоторых знаний C++). Отмечу, что исходная картинка будет трактоваться алгоритмом как «только для чтения» (зачем портить то, с чем могут работать другие методы), и в связи с этим, алгоритму потребуется небольшое количество дополнительной памяти. Кроме того, внешние контуры являются полезным объектом для анализа и векторизации изображений.
Читать дальше →
Total votes 35: ↑34 and ↓1 +33
Views 7.9K
Comments 9

Что общего у монахов, оптического распознавания текстов и козьего сыра?

ABBYY corporate blog
Если вы ответите «ABBYY FineReader», то будете правы. Некоторое время назад в американский офис ABBYY обратился отец Григорий, настоятель монастыря Святого Григория Паламы (St. Gregory Palamas Monastery), с просьбой помочь решить необычную задачу, которая стояла перед монастырём. В монастыре хранится архив старых документов на греческом языке с политонической системой диактрики, которые нужно было оцифровать. Узнав об этом, наши американские коллеги подарили настоятелю коробку ABBYY FineReader 10 Professional Edition. Что это за система и почему отцу Григорию понадобился именно FineReader – читайте под катом.
Читать дальше →
Total votes 53: ↑39 and ↓14 +25
Views 12K
Comments 16

Рунетология (107): основатель компании ABBYY Давид Ян

Lumber room
Давид Ян — о том, как создавался словарь ABBYY Lingvo, как пираты, сами того не понимая, продвигали продажи компании, о первом в мире коммуникаторе Cybiko, о том, как увлечение ресторанным делом снова привело его в IT, о миссии предпринимателя и неочевидных секретах успеха в бизнесе.
Читать дальше →
Total votes 19: ↑16 and ↓3 +13
Views 514
Comments 3

Тестирование ABBYY FineReader 11

Development for Windows *
Недавно вышла 11-я версия известного в России и в мире программного продукта по оптическому распознаванию текста ABBYY FineReader. В этой версии анонсировано множество улучшений, а основной упор делается на увеличение производительности и снижение ошибок. Эти улучшения — в сравнении с 10-й версией. Я же не пользовался этой программой со студенческих лет (с начала 2000-х), и наверняка пропустил версий, эдак, шесть. В те годы интернет и мобильные технологии не были развиты так сильно, а времени было много. Поэтому я был готов брать в библиотеке книгу на час, снимать копии, ехать в один конец города к компьютеру, где есть сканер, затем в другой конец, туда, где есть FineReader, а затем домой, доисправлять ошибки распознавания и форматирования в Word-овских файлах. Сегодня же юзер стал ленивее и требовательнее, поэтому хочу рассмотреть работу с программой в ракурсе современных доступных технологий и острой нехватки времени.
Читать дальше →
Total votes 50: ↑39 and ↓11 +28
Views 3.5K
Comments 27

Кража информации с экрана смартфона

Information Security *

Американские исследователи факультета компьютерных наук из университета Северной Каролины во главе с разработчиком Жаном-Майклом Фремом (Jan-Michael Frahm) представили новый способ шпионажа за пользователями современных гаджетов, причем без необходимости приближаться к устройству или принимать какие-то ухищрения для установки на него вредоносной программы-шпиона.

Суть способа — разработанное программное обеспечение iSpy, которое позволяет с 90%-й точностью распознавать набираемые владельцем гаджета символы по снимкам его экрана (адреса почты, номера кредитных карт и т.д.), которые могут быть сделаны обычным телефоном с расстояния около 3 метров. Причем, если злоумышленник обладает более качественной оптикой, то расстояние до смартфона жертвы можно свободно увеличить до 60 метров.

Таким образом, возник новый класс угроз, избежать которых сами авторы технологии предлагают при помощи защитных экранов или уменьшением размера шрифта набираемого текста.

Подробное описание технологии представлено в отчете здесь.

[Источник]
Total votes 58: ↑46 and ↓12 +34
Views 1.3K
Comments 38

Распознавание непрерывного рукописного текста в режиме off-line

Artificial Intelligence
Sandbox
Предисловие

Как известно, задача распознавания непрерывного рукописного текста в режиме off-line пока считается нерешённой.

Мне удалось решить эту задачу теоретически и практически. Практическая часть сейчас имеет вид демонстрационной версии программы. Решение общее, оно не ограничивается какой-либо областью применения, языком или размером словаря.

О программе

Программа полностью обучаемая. Процесс обучения выглядит просто:
Читать дальше →
Total votes 81: ↑62 and ↓19 +43
Views 27K
Comments 61

How am I driving?

Self Promo
Смотреть на gps карту в машине, когда ты едешь по маршруту в сотый раз невыносимо скучно, гораздо интересней было бы оставлять комментарии другим участникам движения, а так же узнать, что они о тебе думают:



Для этого нужно не так уж и много — приложение с дополненной реальностью и распознаванием номеров на телефоне \ планшете \ навигаторе \ бортовом компьютере с камерой и доступом в интернет.
Читать дальше →
Total votes 174: ↑138 and ↓36 +102
Views 1.2K
Comments 271

Теперь Google Translate для Android переводит с фотографий

Development for Android *
Заграничные поездки становятся всё проще и проще. Приложение Google Translate для платформы Android было значительно обновлено, и новой функцией является перевод с фотографии.

Теперь приложение может распознавать текст и переводить на ваш родной русский, английский, немецкий, французский, чешский, нидерландский, итальянский, польский, португальский, испанский или турецкий язык вывески или даже блюда в меню, поэтому в кафе на чужбине больше не придется после заказа нервно готовить желудок к чему-то непонятному.

Принцип работы программы прост: пользователь делает снимок с нужным фрагментом и выделяет необходимую для перевода область. Далее происходит распознание текста и перевод на серверах Google. Для работы приложения необходимо активное соединение с Интернетом.
Читать дальше →
Total votes 36: ↑32 and ↓4 +28
Views 53K
Comments 26

Автоматический ввод капчи – теория и практика покорения Интернет

Image processing *
В 2011 году 75-летний юбилей термина «спам» знаменовался вводом капчи 200 миллионов раз ЕЖЕДНЕВНО!



Все эти вводы — следствие борьбы администраторов сайтов со спам-ботами.

Автоматизация процесса распознавания капчи для множества людей, активно ведущих бизнес в Интернете, является насущной проблемой. Можно относиться к таким бизнесменам и специалистам как к «нехорошим и надоедливым спамерам». Однако остановить процесс спам-постинга, по крайней мере, в обозримом будущем возможным не представляется.

Ссылочный маркетинг здесь полноценно и уникально сочетает в себе решение задач продвижения, повышения репутации продвигаемого сайта в глазах поисковых систем. Происходит это по той простой причине, что каждая ссылка на сайт (в т.ч. и из спам-поста) повышает его позиции в выдачах Google, Яндекса и т.д. Следовательно, такой способ «убийства двух зайцев одним выстрелом» выгоден изначально. И значительная часть Интернет-бизнесменов должны не бороться со спам-постингом, а пытаться использовать его в своих целях.

Итак, актуальность решения задачи «обход капчи» сомнений не вызывает.



Читать дальше →
Total votes 26: ↑7 and ↓19 -12
Views 132K
Comments 22