Как стать автором
Обновить

Amr Eladawy пожаловался, что он не может бронировать билеты на самолеты из-за имени. Ему объяснили, почему

Время на прочтение 3 мин
Количество просмотров 14K
Ненормальное программирование *IT-инфраструктура *IT-стандарты *Транспорт
imageФото: www.fastbooking.com

Один из пользователей по имени Амр Эладави (Amr Eladawy) рассказал о сложностях, которые возникают у него при попытке забронировать билет на самолет. По словам мужчины, система не способна корректно отобразить его имя.

Пользователь поведал, что при заказе авиабилета, когда агент передает данные авиакомпании, его имя в системе отображается просто как литера А. Он пояснил, что проблема возникала неоднократно, с разными агентами и различными авиаперевозчиками.

Когда же мужчина сам бронирует билет на сайте авиакомпании, то на билете его имя отображается как ELADAWY/AMRMR.
Читать дальше →
Всего голосов 76: ↑41 и ↓35 +6
Комментарии 17

«Яндекс» научила камеру распознавать еду, машины и уравнения

Время на прочтение 2 мин
Количество просмотров 2.1K
Искусственный интеллект IT-компании

Компания «Яндекс» выпустила масштабное обновление умной камеры, благодаря которой нейросеть научилась распознавать марку автомобилей, определять количество белков, жиров и углеводов в чипсах и решать уравнения. Об этом редакции «Хабра» рассказали в пресс-центре компании.

Читать далее
Всего голосов 13: ↑13 и ↓0 +13
Комментарии 0

«Google Объектив» в браузере Chrome теперь может распознавать текст на изображениях и переводить его

Время на прочтение 1 мин
Количество просмотров 3.5K
Google Chrome Софт

Google расширила возможности своего приложения «Объектив» в браузере Chrome. Теперь приложение может не только искать похожие изображения, но и распознавать на них текст. Распознанный текст можно скопировать в исходном виде или перевести с помощью онлайн-переводчика.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Нейросеть МГУ оцифровала 10 тысяч астрономических рукописей о солнечной активности

Время на прочтение 2 мин
Количество просмотров 679
Научно-популярное Искусственный интеллект

Сотрудники МГУ вместе с пермскими и немецкими коллегами перевели в цифровой формат тысячи рукописей о солнечной активности конца XIX — начала XX веков из обсерватории в Цюрихе. Для этого они создали нейросеть, способную с высокой точностью читать рукописные тексты. 

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

В умной камере «Яндекса» появился режим распознавания текста

Время на прочтение 1 мин
Количество просмотров 1K
Машинное обучение *Софт Искусственный интеллект IT-компании

Пресс-служба «Яндекса» рассказала Хабру, что умная камера в фирменном приложении теперь умеет распознавать текст. Пользователь может навести камеру на текст и скопировать его.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 2

Google работает над системой распознавания почерка врачей

Время на прочтение 1 мин
Количество просмотров 2.6K
Машинное обучение *Искусственный интеллект IT-компании

Google работает над системой распознавания почерка врачей. Функцию реализуют на базе приложения Google Lens.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 13

Нейросети «Яндекса» научились расшифровывать архивные рукописные документы

Время на прочтение 2 мин
Количество просмотров 1.6K
Машинное обучение *Искусственный интеллект IT-компании

«Яндекс» научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам»: он открывает всем желающим доступ к более чем 2,5 млн страниц исторических документов с текстовой расшифровкой, рассказали в компании. 

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Комментарии 4

Платформа Финуслуги внедряет технологию проверки документов Smart Engines

Время на прочтение 2 мин
Количество просмотров 419
Блог компании Smart Engines Алгоритмы *Искусственный интеллект Финансы в IT IT-компании

Платформа личных финансов Финуслуги Московской биржи внедрила систему распознавания паспортов, разработанную российской AI-компанией Smart Engines.

Система Smart Engines распознает данные паспортов в неидеальных условиях, например: блики, недостаточное освещение, расположение документа под углом или в виде “книжечки”. Решение считывает основной разворот паспорта за 0,15 сек. и способно определять признаки подделки документов на фотокопиях документов для целей физической идентификации клиента на Финуслугах.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Microsoft представила мультимодальную нейросеть, которая может решать головоломки и распознавать текст

Время на прочтение 2 мин
Количество просмотров 1.4K
Машинное обучение *Научно-популярное Искусственный интеллект

Исследователи из Microsoft представили мультимодальную модель Kosmos-1, которая способна анализировать изображения, решать визуальные головоломки, распознавать текст, проходить визуальные тесты IQ и понимать инструкции на естественном языке. 

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 3

OpenAI выпустила GPT-4

Время на прочтение 3 мин
Количество просмотров 64K
Машинное обучение *Искусственный интеллект Будущее здесь

OpenAI представила новую модель ИИ для интерпретации изображений и текста GPT-4, которую компания назвала «последней вехой в своих усилиях по расширению масштабов глубокого обучения».

Читать далее
Всего голосов 61: ↑60 и ↓1 +59
Комментарии 168

Evernote в России: Слон доехал

Время на прочтение 3 мин
Количество просмотров 11K
Блог компании Evernote
Сегодня наша команда официально запустила сервис Evernote на русском языке — www.evernote.com!

image

Не буду скрывать, мы внимательно отслеживали все упоминания о нашем детище на Хабрахабре, и рады, что многие уже успели оценить возможности «слона», хотя еще и на английском языке. Но поскольку развивался Evernote до последнего времени преимущественно в США, и в Рунете о нем пока знают немногие, имеет смысл рассказать подробнее. Рассказ и видео под катом.

Читать дальше →
Всего голосов 98: ↑93 и ↓5 +88
Комментарии 150

Инфракрасная подсветка для OCR

Время на прочтение 1 мин
Количество просмотров 1.6K
IT-компании
Как известно, Google поставила перед собой отсканировать, распознать и проиндексировать все бумажные книги в мире, то есть всё знание человечества. Однако в реальности этот процесс продвигается не так быстро, как хотелось бы. Самый трудный этап — нормальное распознавание текста. Для программы OCR нужно чёткое изображение страницы без искажений. Все строчки на странице должны быть идеально ровными. На практике же книгу невозможно прижать к сканеру (во многих случаях страницы книги вообще нельзя трогать). Как бы то ни было, возникают характерные искривления по краям страниц. С ними борются программными методами, с разной степенью успешности.

Однако, компания Google придумала, как можно аппаратным способом помочь в решении этой проблемы. На прошлой неделе они получили патент на применение инфракрасных сенсоров при сканировании книг (патент США № 7508978). Суть идеи в том, что инфракрасная сетка позволяет составить трёхмерную модель искривления страницы, так что программа для выравнивания изображения получает чёткие координаты, как нужно преобразовать картинку.



New Scientist
Всего голосов 36: ↑34 и ↓2 +32
Комментарии 34

Переиндексация изображений для русских аккаунтов

Время на прочтение 1 мин
Количество просмотров 1.2K
Блог компании Evernote


Мы уже упоминали о том, что Evernote кое в чём выгодно отличается от человеческой памяти. Последняя с возрастом ухудшается, в то время как Evernote со временем учится «вспоминать» заметки все лучше и лучше за счет расширения функциональности поиска и появления других возможностей. Недавно этот тезис получил еще одно подтверждение: мы завершили переиндексацию текста в изображениях в старых заметках пользователей русскоязычной версии Evernote.

Вскоре после запуска локализованной версии в апреле некоторые пользователи жаловались на то, что на фотографиях и сканах, добавленных до официальной русификации, по-прежнему распознавался только английский текст. Сейчас это неудобство при поиске старых заметок с картинками разрешилось.

Теперь текст распознается во всех изображениях, которые были загружены до 1 мая 2009 года в аккаунты, созданные до 2 апреля 2009 (дата запуска русской версии). Всего было заново распознано около 50 000 изображений.
Всего голосов 35: ↑29 и ↓6 +23
Комментарии 6

Закладка для незрячих

Время на прочтение 1 мин
Количество просмотров 782
Дизайн
image

До сих пор все известные мне концепты книг для слепых представляли собой по большому счету специальное переиздание, в котором либо страницы отображаются шрифтом Брайля, либо текст озвучивается голосом. В общем, если считать книгу устройством, то дизайнеры всегда стремились создавать устройства новые. А вот команда китайцев в лице David Lee, Yuna Kim и Hansub Lee предложила нового ничего не изобретать, а модернизировать старое. В их концепте Haptic Reader книга остается набранной обычным шрифтом для зрячих. Новое – это только полупрозрачная закладка-сканер: кладешь ее на страницу и на гаджете появляются пупырышки Брайля.
Читать дальше →
Всего голосов 49: ↑48 и ↓1 +47
Комментарии 31

Демо-версия Google Docs OCR

Время на прочтение 1 мин
Количество просмотров 2.6K
IT-компании
Как сообщалось вчера, для Google Docs API начали тестировать новую фичу распознавания текстов, как в Evernote. То есть станет возможным просто сфотографировать или отсканировать документ, загрузить картинку в Google Docs — и документ появится там в виде нормального текста

Для активации OCR при загрузке документов через API нужно добавить параметр ocr=true.

В онлайне появилась работающая демо-версия (исходники будут позже). Поддерживаются файлы JPG, GIF и PNG размером до 10 МБ. Распознавание одной страницы текста занимает до 40 секунд (сегодня, очевидно, будет и дольше). Сервис работает с глюками, возможны ошибки.
Читать дальше →
Всего голосов 35: ↑29 и ↓6 +23
Комментарии 22

Распознаем текст, используя расстояние Хэмминга

Время на прочтение 6 мин
Количество просмотров 38K
Искусственный интеллект
На данную статью меня натолкнула статья Alex’а Поветкина — «Распознавание образов методом потенциальных функций»

Итак, мы собираемся написать программу на Delphi (я использую версию 6), способную перевести символы с картинки в текст. Задача довольно популярная в интернете, и на каждый пост «Хочу реализовать распознавание символов!!! Помогите» самые частые ответы «почитай в интернете» либо «не берись, используй файнридер» и тому подобное.

Я, как и многие другие, начал с изучения основных алгоритмов. Конечно, такие монстры как FineReader тратят на алгоритмическую составляющую огромные деньги, и их секретов нам не узнать, но прочей информации было найдено приличное количество, чтобы понять основные методы. Но начнем издалека.
Читать дальше →
Всего голосов 100: ↑91 и ↓9 +82
Комментарии 34

Первая стабильная версия OCR-системы Cuneiform Linux

Время на прочтение 1 мин
Количество просмотров 3.2K
Open source *
Юсси Пакканен сообщил о выходе версии 1.0 системы оптического распознавания текстов Cuneiform Linux. В новой версии удалён некоторый код сомнительного лицензионного происхождения и исправлено множество ошибок.

Код Cuneiform Linux распространяется под упрощённой лицензией BSD и основан на коде системы CuneiForm, который был открыт компанией Cognitive Technologies в 2008 году.

Скачать можно здесь: launchpad.net/cuneiform-linux/+download (инструкции по установке и использованию можно прочитать в топике «Распознаем текст с помощью cuneiform»).
Всего голосов 53: ↑47 и ↓6 +41
Комментарии 14

KBookOCR for Linux. Убийца FineReader-а для Linux на начальной стадии

Время на прочтение 4 мин
Количество просмотров 22K
Настройка Linux *

Вступление


Возможно каждый из нас переживал период в своей жизни который сопровождался активно оцифровкой аналогов материала. Я имею в виду необходимость работы с текстом из неоцифрованных источников. Имеется в виду не только проблема сканирования, но и так же множество материала который к сожалению доходит до конечного потребитель не совсем в пригодном для использования виде. И я думаю у каждого из нас очень часто в голове пробегали лестные мысли об распространителя книги в формате djvu или pdf в котором весь контент был представлен сугубо графически без возможности использование материалов для своей деятельности.
Читать дальше →
Всего голосов 99: ↑71 и ↓28 +43
Комментарии 85

Простая система оптического распознавания символов для .NET

Время на прочтение 4 мин
Количество просмотров 18K
.NET *
Из песочницы
Все началось с необходимости в одном из приложений получать снимок произвольного окна и 3-4 раза в секунду распознавать несколько областей изображения с заранее известными символами. Сделать скриншот окна с помощью WinAPI проблем не составило, а вот над распознаванием пришлось немного потрудиться.
Читать дальше →
Всего голосов 44: ↑33 и ↓11 +22
Комментарии 23

Быстрая маркировка изображений с использованием внешних контуров

Время на прочтение 9 мин
Количество просмотров 8.3K
Обработка изображений *
В статье расскажу как достаточно быстро перечислить связные объекты на бинарном растре. Этот алгоритм мы использовали для распознавания изображений и текстов; он отличается от подобных высокой скоростью обработки (на картинках до 3200x2400, с некоторыми оговорками, он отрабатывает за миллисекунды) и доступностью в понимании (при наличии некоторых знаний C++). Отмечу, что исходная картинка будет трактоваться алгоритмом как «только для чтения» (зачем портить то, с чем могут работать другие методы), и в связи с этим, алгоритму потребуется небольшое количество дополнительной памяти. Кроме того, внешние контуры являются полезным объектом для анализа и векторизации изображений.
Читать дальше →
Всего голосов 35: ↑34 и ↓1 +33
Комментарии 9