С момента, когда мы вслух заявили о распознавании паспорта гражданина РФ на мобильном телефоне прошло уже более трех лет. За это время мы научили наш движок распознавать различные документы, удостоверяющие личность, для более, чем 165 стран мира. Но в этой статье мы решили не писать про высокую важность и сложность технологии, грандиозные масштабы разработки, а сосредоточиться на описании интересного с точки зрения автоматизации народного хозяйства варианта использования нашего движка. Если вам 18+, а также интересны подробности, добро пожаловать под кат.
Как мы научили нейросеть определять документы
Этим летом мы научили нейронную сеть определять, присутствует ли на изображении документ, и если да — то какой именно.
Для чего это понадобилось
Чтобы разгрузить сотрудников и обезопасить людей от мошенников. Мы применяем новую нейросеть в двух сферах: когда пользователь восстанавливает доступ к странице и для скрытия личных документов из общего поиска.
Transfer Learning: как быстро обучить нейросеть на своих данных
В этой статье я расскажу, как использовать метод Transfer Learning на примере распознавания изображений с едой. Про другие инструменты машинного обучения я расскажу на воркшопе «Machine Learning и нейросети для разработчиков».
Восстанавливаем детальную геометрию объектов для более точной валидации ассортимента
Предположим, необходимо отобрать только хорошие фотографии тех или иных объектов, для последующего использования в e-commerce. Под хорошими будем подразумевать фотографии без лишних деталей с доминирующим основным объектом.
Как искусственный интеллект помогает работать с юридическими документами? Лекция Егора Будникова из ABBYY
— У компании могут быть развитые методологии анализа данных и электронный документооборот, при этом от клиентов или от соседних отделов в компанию могут приходить документы, созданные в Word, при этом распечатанные, отксерокопированные, отсканированные и принесенные на флешке.
Что же делать с документооборотом, который есть сейчас, с «грязными» документами, с бумажным хранением, вплоть до того, что документы могут храниться до 70 лет, прежде чем они отсканированы и должны быть распознаны?
Комплекс детекции курения по фото или видео на базе Intel NUC
В этом посте мы расскажем о том, как решали задачу определения факта курения посредством объектовой видеоаналитики на Intel NUC. На входе – видеопотоки с камер видеонаблюдения, которые декодируются, нарезаются на вычислителе на фреймы, а далее каждый фрейм (с учетом делителя кадровой частоты) отдается нейронной сети, которая детектирует наличие факта курения и возвращает вероятность события.
Пять лет интенсивного развития рынка распознавания документов
Хотя мы в Smart Engines, конечно, лютые технари, все равно очень любим дни рождения и юбилеи. Особенно, если виновник торжества — такое родное и милое, за развитием которого ты наблюдаешь каждый день. Да-да, на прошлой неделе мы праздновали пятилетие нашего главного продукта – системы распознавания паспорта РФ.
HoughNet: поиск точек схода сетью, сплавленной с классическим алгоритмом
Пока в мире распознавания объектов обучают десятки и даже сотни зарекомендовавших себя архитектур искусственных нейронных сетей (ИНС), разогревая планету мощными видеокарточками и создавая «панацею» для всех задач компьютерного зрения, мы в Smart Engines твердо идем по исследовательскому пути, предлагая новые эффективные архитектуры ИНС для решения конкретных задач. Сегодня мы расскажем про ХафНет – новый способ поиска точек схода на изображениях.
Алгоритм распознавания ценников, который работает даже на терминалах сбора данных
Привет, Хабр! Сегодня мы продолжаем нашу классическую серию статей про то, как с использованием методов обработки изображений и распознавания образов сделать что-то полезное с практической точки зрения. Сегодня речь пойдет о задаче распознавания ценников. Обычных ценников товаров, которые каждый может встретить в любом магазине. Только для обеспечения должной практичности мы добавим важное требование в постановку задачи: распознаваемые изображения получают при помощи малоформатной цифровой камеры, а вычислительное устройство имеет существенные ограничения по ресурсам. Другими словами, мы расскажем, как распознавать ценники на вычислительно слабом мобильном устройстве (кстати, здесь речь идет не столько о дешевом китайском смартфоне, сколько о специальных промышленных терминалах сбора данных, которые в силу ряда причин тоже обладают достаточно слабыми “мозгами”). Итак, если Вам интересна тема автоматизации ритейла, добро пожаловать под кат!
Регуляризация? Ортогонализация! Улучшаем компактные сети
Пока другие компании обсуждают управление коллективом на удаленке, мы в Smart Engines продолжаем делиться с вами своим стеком технологий. Сегодня про оптимизацию нейронных сетей. Сделать систему распознавания на основе нейронных сетей, которая могла бы быстро работать на смартфонах и прочих мобильных устройствах – крайне непросто. А сделать так, чтобы при этом качество было высоким – еще сложнее. В этой статье мы расскажем о простом методе регуляризации нейронных сетей, используемом нами в Smart Engines для улучшения качества «мобильных» сетей с малым числом параметров. Идея метода основана на постепенном уменьшении линейной зависимости фильтров в сверточных слоях во время обучения, благодаря чему каждый нейрон работает более эффективно, и следовательно, улучшается обобщающая способность модели. Для этого мы представляем фильтры в виде одномерных векторов и ортогонализируем пару с наибольшей длиной проекции друг на друга.
Как избавиться от размытых фотографий с помощью Python
Некачественные снимки напрямую снижают прибыль.
- Как приложению распознавать нечеткие фотографии на уровне алгоритма?
- Как измерить четкость RGB-изображения?
Локализация QR-кода – важная задача, незаслуженно обделенная вниманием
Философия затворничества: как удаленная идентификация выручает нас в непростое время
Уверены, что самоизоляция скоро кончится, мы смиримся с вирусом, который и дальше (как нам говорят специалисты) будет жить рядом с нами, мутировать и размножаться. А пока человечество пережидает, мы формируем новые потребительские привычки. Сервисы и приложения, которые не так давно были вспомогательными, а сегодня выходят на первый план. Мы не замечаем того, что многие повседневные услуги возможно получить только при очном подтверждении личности. Это возможно сделать, предъявив паспорт (в ряде случаев другой, приравненный к нему документ), как правило ответственному сотруднику организации, которая предоставляет нам услуги. Несмотря на активный перевод на цифровые рельсы многих государственных и муниципальных услуг, а также услуг в финансовой, страховой сфере, первичное обращение в организацию требует предъявления паспорта. Но как это сделать, когда одной стороне (клиенту) запрещено выходить из дома, а другая сторона (банк, страховая, нотариус, представитель оператора связи) находится на удаленном режиме работы? Здесь на помощь приходит удаленная идентификация личности.
Istock/ipopba
Альтернативный метод классификации поля «пол» паспорта РФ с помощью нейронной сети
Источник: https://wiki.loginom.ru/articles/clustering.html
Задача распознавания текста не теряет своей актуальности на протяжении последних десятилетий. А сейчас, в период повсеместного введения дистанционного оформления документов, не обойтись без процедуры идентификации личности.
Классическая процедура распознавания текста включает в себя его локализацию, сегментацию и непосредственно распознавание. Методы, использующие сегментацию текста на символы, довольно популярны и хорошо изучены. Однако существуют такие виды текста, где сегментация на символы становится настоящим испытанием. Например, арабская и индийская письменности. Кроме того, различные повреждения изображений текста также затрудняют его сегментацию. Очевидным решением при ограниченном множестве слов является распознавание их целиком, без разбора на символы. При условии наличия полного словаря с этой задачей отлично справляются обычные классифицирующие нейронные сети. Но что же делать в случае, если словарь достаточно большой или вовсе не известен на этапе обучения?
Как лазеры и сенсоры помогают сохранить нервы судьям
Оценить выступление спортсмена – задача, которая с каждым годом не становится проще. Увеличиваются скорости, усложняются программы, появляются новые элементы и их связки. Сравните хотя бы выступления фигуристов или гимнастов в Лондоне, Рио, Ванкувере или Сочи и программы, за которые их предшественники получали золото полвека назад. Разницу ощутит даже тот, кто не следит за спортом.
А судьи кто? Пусть и прекрасно разбирающиеся в своей сфере, но все же обычные люди, которые устают, отвлекаются, моргают, поддаются эмоциям. Результат – спорные решения, после которых болельщики готовы отправить всю судейскую коллегию «на мыло».
Раз человек не идеален, то почему бы не компенсировать слабые стороны последними достижениями науки и техники. Очередной dead heat у финиша навел Эдварда Мейбриджа на мысль, что вовремя сделанная фотография пересекающих черту скакунов избавит от горячих споров и не менее горячих их последствий, когда ставки столь высоки. К практике перешли быстро и впервые фотофиниш во время скачек был использован уже в конце XIX века. Первый видеоповтор отметит в этом году 65-летний юбилей. В теннисе еще с 1970-х годов используется electronic line judge – компьютеризированная система, которая определяет куда приземлился мяч.
Такие системы эффективны, когда к победе ведет определенное действие (пересечь финиш первым, забить мяч в ворота, прыгнуть выше соперников и т. д.), но почти бесполезны, когда лучшего определяют, например, по технике выполнения элементов, их количеству и последовательности в программе. Здесь нужно что-то посложнее простого Instant Replay. Компания Fujitsu в качестве решения видит технологию 3D-сенсоров, которая позволяет в реальном времени сканировать, оцифровывать и оценивать движения атлетов. Подробнее о принципе ее работы под катом.
Распознавание документов и лиц: объединение во имя свободы или шаг к цифровой диктатуре?
Распространение по миру вируса COVID-19 вызвало резкое изменение паттернов потребительского поведения. В условиях роста панических настроений и предписаний соблюдать социальную дистанцию растет доля тех потребителей, которые сознательно или вынужденно отказываются от физического контакта с продавцом.
Тем самым стимулируется развитие дистанционных услуг и сервисов, таких как онлайн-заказ продуктов, бесконтактная курьерская доставка товаров повседневного спроса, оформление договоров на банковское и страховое обслуживание, открытие вкладов, получение дистанционной медицинской и юридической помощи. Более активно происходит замещение оборота наличных денег в торговле различными инструментами бесконтактных и дистанционных платежей.
iStock OJO_Images
Удалённая банковская идентификация: от сложного к простому, или Банки, зачем вам биометрия?
(Изображение взято отсюда)
Не всегда усложнение технологии ведет к улучшению результата. В сегодняшней статье мы постараемся показать, что сложное техническое решение по биометрической идентификации и аутентификации клиентов в банковских приложениях вполне заменимо традиционным предъявлением паспорта, но в современной интерпретации “подключенного мира”: в качестве “проверяющего” сотрудника банка вполне может выступать приложение с внедренным модулем распознавания и проверки документа. Мы не ставим своей целью критиковать или ставить под сомнение необходимость развития биометрических способов идентификации личности как самостоятельного технологического направления. Мы показываем, что современные технологии догоняют друг друга, постепенно совершенствуясь за счет упрощения и “облегчения” алгоритмов.
Как мы используем алгоритмы компьютерного зрения: обработка видео в мобильном браузере с помощью OpenCV.js
Рассмотрим, как алгоритмы компьютерного зрения помогают распознавать документы в видеопотоке прямо в браузерах мобильных устройств. В статье делимся опытом, как мы в SimbirSoft использовали для этого OpenCV.js, какие возможны сложности, как обеспечить быстродействие и получить «гладкий» UX без подтормаживания.
Пробел не так прост как кажется
Биометрия в платежах – основы технологии
Сегодня мы постоянно слышим в новостях «запущен проект по распознаванию лиц на транспорте», «в кафе NN реализовано распознавание лиц для оплаты», «в компании ZZ организован проход в офис по лицу» и прочие «яркие» заголовки. Кроме того, многие люди привыкли к использованию FaceID на своих смартфонах. Но, как обычно, известное – не есть от того познанное. Начнём с основ, чтобы разобраться в предмете.