Как стать автором
Обновить

Автоматизация секс-индустрии или госуслуги по-немецки

Время на прочтение3 мин
Количество просмотров41K

С момента, когда мы вслух заявили о распознавании паспорта гражданина РФ на мобильном телефоне прошло уже более трех лет. За это время мы научили наш движок распознавать различные документы, удостоверяющие личность, для более, чем 165 стран мира. Но в этой статье мы решили не писать про высокую важность и сложность технологии, грандиозные масштабы разработки, а сосредоточиться на описании интересного с точки зрения автоматизации народного хозяйства варианта использования нашего движка. Если вам 18+, а также интересны подробности, добро пожаловать под кат.

Всего голосов 39: ↑32 и ↓7+25
Комментарии35

Как мы научили нейросеть определять документы

Время на прочтение4 мин
Количество просмотров10K


Этим летом мы научили нейронную сеть определять, присутствует ли на изображении документ, и если да — то какой именно.

Для чего это понадобилось


Чтобы разгрузить сотрудников и обезопасить людей от мошенников. Мы применяем новую нейросеть в двух сферах: когда пользователь восстанавливает доступ к странице и для скрытия личных документов из общего поиска.

Читать дальше →
Всего голосов 22: ↑21 и ↓1+20
Комментарии1

Transfer Learning: как быстро обучить нейросеть на своих данных

Время на прочтение11 мин
Количество просмотров46K
Машинное обучение становится доступнее, появляется больше возможностей применять эту технологию, используя «готовые компоненты». Например, Transfer Learning позволяет использовать накопленный при решении одной задачи опыт для решения другой, аналогичной проблемы. Нейросеть сначала обучается на большом объеме данных, затем — на целевом наборе.

Food recognition

В этой статье я расскажу, как использовать метод Transfer Learning на примере распознавания изображений с едой. Про другие инструменты машинного обучения я расскажу на воркшопе «Machine Learning и нейросети для разработчиков».
Читать дальше →
Всего голосов 13: ↑11 и ↓2+9
Комментарии8

Восстанавливаем детальную геометрию объектов для более точной валидации ассортимента

Время на прочтение2 мин
Количество просмотров2.3K
Занимаясь вопросами качества поиска, рано или поздно приходится столкнуться с задачей визуальной валидации продуктов. Опустим простые задачи, с которыми справится обычный классификатор, сосредоточившись на случаях, которые требуют более или менее точной геометрии объекта:



Предположим, необходимо отобрать только хорошие фотографии тех или иных объектов, для последующего использования в e-commerce. Под хорошими будем подразумевать фотографии без лишних деталей с доминирующим основным объектом.
Читать дальше →
Всего голосов 16: ↑11 и ↓5+6
Комментарии3

Как искусственный интеллект помогает работать с юридическими документами? Лекция Егора Будникова из ABBYY

Время на прочтение11 мин
Количество просмотров7K
Недавно системный аналитик технологического департамента компании ABBYY Егор Будников выступил в «Яндексе» на конференции «Data & Science: закон и делопроизводство». Он рассказал, как работает компьютерное зрение, происходит обработка текстов, на что важно обращать внимание при извлечении информации из юридических документов и о многом другом.


— У компании могут быть развитые методологии анализа данных и электронный документооборот, при этом от клиентов или от соседних отделов в компанию могут приходить документы, созданные в Word, при этом распечатанные, отксерокопированные, отсканированные и принесенные на флешке.

Что же делать с документооборотом, который есть сейчас, с «грязными» документами, с бумажным хранением, вплоть до того, что документы могут храниться до 70 лет, прежде чем они отсканированы и должны быть распознаны?
Читать дальше →
Всего голосов 16: ↑16 и ↓0+16
Комментарии1

Комплекс детекции курения по фото или видео на базе Intel NUC

Время на прочтение5 мин
Количество просмотров4.5K
Intel NUC8i5BEK

В этом посте мы расскажем о том, как решали задачу определения факта курения посредством объектовой видеоаналитики на Intel NUC. На входе – видеопотоки с камер видеонаблюдения, которые декодируются, нарезаются на вычислителе на фреймы, а далее каждый фрейм (с учетом делителя кадровой частоты) отдается нейронной сети, которая детектирует наличие факта курения и возвращает вероятность события.
Читать дальше →
Всего голосов 8: ↑7 и ↓1+6
Комментарии9

Пять лет интенсивного развития рынка распознавания документов

Время на прочтение3 мин
Количество просмотров1.9K

Хотя мы в Smart Engines, конечно, лютые технари, все равно очень любим дни рождения и юбилеи. Особенно, если виновник торжества — такое родное и милое, за развитием которого ты наблюдаешь каждый день. Да-да, на прошлой неделе мы праздновали пятилетие нашего главного продукта – системы распознавания паспорта РФ.

Всего голосов 7: ↑5 и ↓2+3
Комментарии0

HoughNet: поиск точек схода сетью, сплавленной с классическим алгоритмом

Время на прочтение7 мин
Количество просмотров2.3K

Пока в мире распознавания объектов обучают десятки и даже сотни зарекомендовавших себя архитектур искусственных нейронных сетей (ИНС), разогревая планету мощными видеокарточками и создавая «панацею» для всех задач компьютерного зрения, мы в Smart Engines твердо идем по исследовательскому пути, предлагая новые эффективные архитектуры ИНС для решения конкретных задач. Сегодня мы расскажем про ХафНет – новый способ поиска точек схода на изображениях.

Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии0

Алгоритм распознавания ценников, который работает даже на терминалах сбора данных

Время на прочтение8 мин
Количество просмотров3.6K

Привет, Хабр! Сегодня мы продолжаем нашу классическую серию статей про то, как с использованием методов обработки изображений и распознавания образов сделать что-то полезное с практической точки зрения. Сегодня речь пойдет о задаче распознавания ценников. Обычных ценников товаров, которые каждый может встретить в любом магазине. Только для обеспечения должной практичности мы добавим важное требование в постановку задачи: распознаваемые изображения получают при помощи малоформатной цифровой камеры, а вычислительное устройство имеет существенные ограничения по ресурсам. Другими словами, мы расскажем, как распознавать ценники на вычислительно слабом мобильном устройстве (кстати, здесь речь идет не столько о дешевом китайском смартфоне, сколько о специальных промышленных терминалах сбора данных, которые в силу ряда причин тоже обладают достаточно слабыми “мозгами”). Итак, если Вам интересна тема автоматизации ритейла, добро пожаловать под кат!


Читать дальше →
Всего голосов 5: ↑5 и ↓0+5
Комментарии9

Регуляризация? Ортогонализация! Улучшаем компактные сети

Время на прочтение7 мин
Количество просмотров4.6K

Пока другие компании обсуждают управление коллективом на удаленке, мы в Smart Engines продолжаем делиться с вами своим стеком технологий. Сегодня про оптимизацию нейронных сетей. Сделать систему распознавания на основе нейронных сетей, которая могла бы быстро работать на смартфонах и прочих мобильных устройствах – крайне непросто. А сделать так, чтобы при этом качество было высоким – еще сложнее. В этой статье мы расскажем о простом методе регуляризации нейронных сетей, используемом нами в Smart Engines для улучшения качества «мобильных» сетей с малым числом параметров. Идея метода основана на постепенном уменьшении линейной зависимости фильтров в сверточных слоях во время обучения, благодаря чему каждый нейрон работает более эффективно, и следовательно, улучшается обобщающая способность модели. Для этого мы представляем фильтры в виде одномерных векторов и ортогонализируем пару с наибольшей длиной проекции друг на друга.
Читать дальше →
Всего голосов 11: ↑11 и ↓0+11
Комментарии14

Как избавиться от размытых фотографий с помощью Python

Время на прочтение6 мин
Количество просмотров9.7K
Когда мы делаем большую серию снимков, часть из них получается нечеткими. С такой же проблемой столкнулась крупная автомобильная компания. Часть фотографий при осмотре авто получались размытой, что могло негативно влиять на продажи.

Некачественные снимки напрямую снижают прибыль.


  • Как приложению распознавать нечеткие фотографии на уровне алгоритма?
  • Как измерить четкость RGB-изображения?


Читать дальше →
Всего голосов 15: ↑14 и ↓1+13
Комментарии11

Локализация QR-кода – важная задача, незаслуженно обделенная вниманием

Время на прочтение10 мин
Количество просмотров6.3K
Уверены, что на сегодняшний день не найдется ни одного читателя Хабра, который не был бы знаком с QR-кодами. Эти двумерные штрихкоды повсюду. Закономерно, что в мире существует много инструментов, позволяющих с некоторой долей эффективности добавить QR-коды в свой проект. Вся соль в том, что эта упомянутая эффективность напрямую зависит от качества инструмента, который используется для распознавания QR-кодов. И тут возникает классическая вилка: можно решить задачу (очень) хорошо и (очень) дорого, а можно бесплатно и как-то. А можно ли доработать бесплатное так, чтобы все-таки решить задачу хорошо? Если интересно, заглядывайте под кат.
Читать дальше →
Всего голосов 9: ↑8 и ↓1+7
Комментарии9

Философия затворничества: как удаленная идентификация выручает нас в непростое время

Время на прочтение6 мин
Количество просмотров1.7K

Уверены, что самоизоляция скоро кончится, мы смиримся с вирусом, который и дальше (как нам говорят специалисты) будет жить рядом с нами, мутировать и размножаться. А пока человечество пережидает, мы формируем новые потребительские привычки. Сервисы и приложения, которые не так давно были вспомогательными, а сегодня выходят на первый план. Мы не замечаем того, что многие повседневные услуги возможно получить только при очном подтверждении личности. Это возможно сделать, предъявив паспорт (в ряде случаев другой, приравненный к нему документ), как правило ответственному сотруднику организации, которая предоставляет нам услуги. Несмотря на активный перевод на цифровые рельсы многих государственных и муниципальных услуг, а также услуг в финансовой, страховой сфере, первичное обращение в организацию требует предъявления паспорта. Но как это сделать, когда одной стороне (клиенту) запрещено выходить из дома, а другая сторона (банк, страховая, нотариус, представитель оператора связи) находится на удаленном режиме работы? Здесь на помощь приходит удаленная идентификация личности.



Istock​/ipopba

Читать дальше →
Всего голосов 4: ↑3 и ↓1+2
Комментарии3

Альтернативный метод классификации поля «пол» паспорта РФ с помощью нейронной сети

Время на прочтение6 мин
Количество просмотров3.3K

Источник: https://wiki.loginom.ru/articles/clustering.html


Задача распознавания текста не теряет своей актуальности на протяжении последних десятилетий. А сейчас, в период повсеместного введения дистанционного оформления документов, не обойтись без процедуры идентификации личности.


Классическая процедура распознавания текста включает в себя его локализацию, сегментацию и непосредственно распознавание. Методы, использующие сегментацию текста на символы, довольно популярны и хорошо изучены. Однако существуют такие виды текста, где сегментация на символы становится настоящим испытанием. Например, арабская и индийская письменности. Кроме того, различные повреждения изображений текста также затрудняют его сегментацию. Очевидным решением при ограниченном множестве слов является распознавание их целиком, без разбора на символы. При условии наличия полного словаря с этой задачей отлично справляются обычные классифицирующие нейронные сети. Но что же делать в случае, если словарь достаточно большой или вовсе не известен на этапе обучения?

Читать дальше →
Всего голосов 7: ↑7 и ↓0+7
Комментарии4

Как лазеры и сенсоры помогают сохранить нервы судьям

Время на прочтение11 мин
Количество просмотров2.4K
Привет, Хабр!

Оценить выступление спортсмена – задача, которая с каждым годом не становится проще. Увеличиваются скорости, усложняются программы, появляются новые элементы и их связки. Сравните хотя бы выступления фигуристов или гимнастов в Лондоне, Рио, Ванкувере или Сочи и программы, за которые их предшественники получали золото полвека назад. Разницу ощутит даже тот, кто не следит за спортом.



А судьи кто? Пусть и прекрасно разбирающиеся в своей сфере, но все же обычные люди, которые устают, отвлекаются, моргают, поддаются эмоциям. Результат – спорные решения, после которых болельщики готовы отправить всю судейскую коллегию «на мыло».
Раз человек не идеален, то почему бы не компенсировать слабые стороны последними достижениями науки и техники. Очередной dead heat у финиша навел Эдварда Мейбриджа на мысль, что вовремя сделанная фотография пересекающих черту скакунов избавит от горячих споров и не менее горячих их последствий, когда ставки столь высоки. К практике перешли быстро и впервые фотофиниш во время скачек был использован уже в конце XIX века. Первый видеоповтор отметит в этом году 65-летний юбилей. В теннисе еще с 1970-х годов используется electronic line judge – компьютеризированная система, которая определяет куда приземлился мяч.

Такие системы эффективны, когда к победе ведет определенное действие (пересечь финиш первым, забить мяч в ворота, прыгнуть выше соперников и т. д.), но почти бесполезны, когда лучшего определяют, например, по технике выполнения элементов, их количеству и последовательности в программе. Здесь нужно что-то посложнее простого Instant Replay. Компания Fujitsu в качестве решения видит технологию 3D-сенсоров, которая позволяет в реальном времени сканировать, оцифровывать и оценивать движения атлетов. Подробнее о принципе ее работы под катом.
Всего голосов 7: ↑6 и ↓1+5
Комментарии5

Распознавание документов и лиц: объединение во имя свободы или шаг к цифровой диктатуре?

Время на прочтение6 мин
Количество просмотров4.3K

Распространение по миру вируса COVID-19 вызвало резкое изменение паттернов потребительского поведения. В условиях роста панических настроений и предписаний соблюдать социальную дистанцию растет доля тех потребителей, которые сознательно или вынужденно отказываются от физического контакта с продавцом.


Тем самым стимулируется развитие дистанционных услуг и сервисов, таких как онлайн-заказ продуктов, бесконтактная курьерская доставка товаров повседневного спроса, оформление договоров на банковское и страховое обслуживание, открытие вкладов, получение дистанционной медицинской и юридической помощи. Более активно происходит замещение оборота наличных денег в торговле различными инструментами бесконтактных и дистанционных платежей.


iStock​ OJO_Images
Читать дальше →
Всего голосов 7: ↑6 и ↓1+5
Комментарии11

Удалённая банковская идентификация: от сложного к простому, или Банки, зачем вам биометрия?

Время на прочтение8 мин
Количество просмотров14K

(Изображение взято отсюда)

Не всегда усложнение технологии ведет к улучшению результата. В сегодняшней статье мы постараемся показать, что сложное техническое решение по биометрической идентификации и аутентификации клиентов в банковских приложениях вполне заменимо традиционным предъявлением паспорта, но в современной интерпретации “подключенного мира”: в качестве “проверяющего” сотрудника банка вполне может выступать приложение с внедренным модулем распознавания и проверки документа. Мы не ставим своей целью критиковать или ставить под сомнение необходимость развития биометрических способов идентификации личности как самостоятельного технологического направления. Мы показываем, что современные технологии догоняют друг друга, постепенно совершенствуясь за счет упрощения и “облегчения” алгоритмов.
Всего голосов 2: ↑1 и ↓10
Комментарии2

Как мы используем алгоритмы компьютерного зрения: обработка видео в мобильном браузере с помощью OpenCV.js

Время на прочтение7 мин
Количество просмотров3.4K
Для идентификации личности онлайн уже есть все возможности, но пока их применяют крайне редко. Пожалуй, одними из первых мы реализовали оптимальный сценарий для пользователя – зайти на сайт со смартфона, сфотографировать свои водительские права или паспорт и отправить данные в систему.

Рассмотрим, как алгоритмы компьютерного зрения помогают распознавать документы в видеопотоке прямо в браузерах мобильных устройств. В статье делимся опытом, как мы в SimbirSoft использовали для этого OpenCV.js, какие возможны сложности, как обеспечить быстродействие и получить «гладкий» UX без подтормаживания.


Читать дальше →
Всего голосов 7: ↑7 и ↓0+7
Комментарии0

Пробел не так прост как кажется

Время на прочтение3 мин
Количество просмотров5.3K
Всем привет! Как вы уже знаете, мы в SE занимаемся распознаванием текста (и не только) на разных документах. Сегодня мы хотели бы рассказать еще об одной проблеме при распознавании текста на сложных фонах — о распознавании пробелов. Вообще, мы будем говорить об имени на банковских картах, но для начала пример с «призраком» буквы Ё. Как видите, тут справа от D искажения и фон сформировали достаточно четкую Ё. При этом, если показать эту ячейку отдельно от всего остального, человек (или нейронная сеть) уверенно скажет, что буква есть.


Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии11

Биометрия в платежах – основы технологии

Время на прочтение12 мин
Количество просмотров5.6K

Сегодня мы постоянно слышим в новостях «запущен проект по распознаванию лиц на транспорте», «в кафе NN реализовано распознавание лиц для оплаты», «в компании ZZ организован проход в офис по лицу» и прочие «яркие» заголовки. Кроме того, многие люди привыкли к использованию FaceID на своих смартфонах. Но, как обычно, известное – не есть от того познанное. Начнём с основ, чтобы разобраться в предмете.

Разобраться
Всего голосов 5: ↑5 и ↓0+5
Комментарии8