Обновить
16K+
84

Пользователь

19
Рейтинг
180
Подписчики
Отправить сообщение

Ваш KYC не работает: почему цифровые подделки документов стали опаснее бумажных

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели9.2K

Когда говорят о подделке документов, обычно подразумевают попытку обмануть человека. Но сегодня документы все чаще проверяют не сотрудники банков и служб безопасности, а алгоритмы цифрового онбординга, KYC и удаленной идентификации.

Поэтому появились подделки нового типа — рассчитанные не на людей, а на компьютеры. Их задача не выглядеть идеально, а заставить систему распознавания извлечь нужные реквизиты и пропустить заявку дальше.

Как выглядят такие атаки, почему существующие решения часто оказываются к ним не готовы и зачем мы создали открытый датасет цифровых подделок документов MIDV-DM — расскажем под катом.

Читать далее

Встраиваем проверку возраста без ЕБС в Telegram, MAX и любой другой мессенджер

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели9.4K

Привет, Хабр! Говоря о проверке возраста для доступа к онлайн-платформам, нельзя обойти стороной один из наиболее очевидных кейсов: мессенджеры. Они давно вышли за рамки простого обмена сообщениями – и для многих новых функций есть конкретные возрастные ограничения. В этой статье мы поговорим о том, как за пару минут интегрировать распознавание паспорта для удобной возрастной идентификации в мини-приложение мессенджера – без биометрии, ЕБС и раскрытия персональных данных. С кодом и видео. В общем, заглядывайте под кат!

Читать далее

Проверка возраста без персональных данных и биометрии: встраиваем в веб-страницу за 5 минут

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели10K

Продолжаем рассказывать об альтернативном способе подтверждения возраста на веб-ресурсах без использования биометрии, интеграции с ЕБС и раскрытия персональных данных. О том, как это можно сделать, мы подробно писали в прошлой статье. Теперь разберемся, как реализовать подобный сценарий с помощью WebAssembly и какие возможности это открывает для веб-платформ. В этом материале показываем код, ищите под катом. 

Читать далее

Совершеннолетний без лишних разглашений: можно ли проверить возраст пользователя без биометрии, ЕБС и рисков утечек

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели8K

Привет, Хабр! Пока Минцифры изучает введение возрастной идентификации на онлайн-платформах и весь мир ищет способы проверять возраст пользователей, не подвергая риску конфиденциальность их персональных данных, мы в Smart Engines пришли с готовым решением. В этой статье рассказываем о простом способе идентификации возраста пользователей в веб-среде, который не требует биометрии, раскрытия персональных данных и не несет рисков утечек. Мы реализовали это с помощью WASM-модуля, который позволяет решать задачу проверки возраста в интернете также надежно и безопасно для пользователя, как и в обычной жизни. Заглядывайте под кат!

Читать далее

Большинство исследований в компьютерной томографии нельзя воспроизвести

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели8.7K

Мы не собирались писать эту статью. Мы всего лишь хотели воспроизвести результаты открытого бенчмарка ICASSP-2024 по низкодозовой компьютерной томографии, сравнить их с алгоритмами Smart Tomo Engine и понять свое место относительно опубликованных baseline и SOTA-решений.

Сначала всё шло по плану. Потом более быстрый алгоритм неожиданно оказался точнее более медленного. Затем на картах ошибок начали повторяться странные структуры. А спустя несколько дней выяснилось, что часть измеряемого качества может определяться не реконструкцией томографических данных, а особенностями самого бенчмарка.

Так обычная задача воспроизведения результатов превратилась в расследование. В этой статье мы покажем, что именно удалось обнаружить, почему воспроизводимость в компьютерной томографии оказывается намного сложнее, чем кажется, и почему хороший результат в таблице лидеров не всегда означает хороший алгоритм.

Читать далее

Технологии распознавания паспорта – 10 лет.  Хабрология от Smart Engines

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели3.4K

Десять лет назад, 17 марта 2015 года, мы опубликовали свой самый первый хабр. Тогда мы впервые представили городу и миру нашу технологию распознавания паспорта на мобильнике. Публика в комментах разделилась на два лагеря: одни сомневались в пользе решения, другие критиковали за недостаток возможностей и предлагали идеи по улучшению. 

Теперь, с высоты уже немалого времени докладываем: 1) идея себя оправдала и даже превзошла самые смелые ожидания; 2) работа по совершенствованию технологии была проделана; 3) работы было и будет очень много. Собрали для вас хайлайты этой увлекательной и яркой истории.

Как это было?

Томографическая реконструкция реактивного двигателя в сборе: как мы это сделали?

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6K

Приём, Хабр! На связи отдел компьютерной томографии Smart Engines. Сегодня хотим поделиться нашими результатами по КТ-исследованиям реактивных двигателей, рассказать о том, почему недостаточно просто взять и измерить, и как нам удалось не потерять лопасти.

Под катом – красивые трехмерные изображения реактивного двигателя, КТ взорвавшегося двигателя, а также ответ на вопрос, стоит ли верить своим глазам.

Читать далее

Распознавание день в день: как настроить шаблон нового документа без программирования

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели2.8K

Привет, Хабр! Вы прекрасно знаете, что мы в Smart Engines непрерывно совершенствуем наши системы распознавания российского паспорта и других документов. Вместе с этим мы постоянно расширяем список документов, которые могут быть распознаны при помощи наших решений, – и будем делать это и дальше. Но что если бизнесу нужно оперативно настроить распознавание нового корпоративного документа с жесткой структурой? Сегодня такая потребность есть практически у любой организации.

Можно прийти с этой задачей к нам, и мы обязательно поможем. Но есть и альтернативный сценарий – встроить возможность настройки распознавания к себе. Для этого мы выпустили специальный инструмент – дизайнер форм. С ним ждать никого не придется, а добавлять распознавание новых форм можно будет по мере их появления, буквально день в день. О нем мы сегодня и поговорим.

Читать далее

Квантованные БМ сети: упрощаем типы данных

Уровень сложностиСложный
Время на прочтение6 мин
Охват и читатели1.5K

Как вы уже видели, регулярно читая наш блог, мы не только занимаемся разработкой промышленных систем распознавания документов (паспортов, кадрового документооборота, первички и т.п.), но и активно развиваем перспективные технологии в области компьютерного зрения. Сегодняшняя статья из области эффективных нейросетевых архитектур.

Биполярные морфологические (БМ) сети – нейронные сети от Smart Engines практически без умножения. Мы уже показали, что они успешно справляются с задачами классификации изображений и поиска объектов на изображениях. Однако для достижения высокой вычислительной и энергоэффективности важно не только максимально упростить используемые операции, но и взять максимально простой и компактный тип данных, то есть отквантовать нейронную сеть. Так что насчет квантования БМ сетей?

Читать далее

Фильтр Гаусса на стероидах: подход на точность вычислений

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.1K

Hello, world! Это вторая часть хабростатьи Smart Engines про быструю фильтрацию изображений. Да-да, создавая топовый продукт по распознаванию документов, нам приходится разбираться в методах обработки изображений на экспертном уровне (иначе не получилось бы распознать изображение паспорта за 150 мс на мобильном телефон). В предыдущей части мы начали обсуждать быстрые аппроксимации гауссовского фильтра, которым была посвящена наша недавняя публикация в научном журнале MDPI Applied Sciences [1]. О том, как работает оригинальный фильтр Гаусса, мы уже писали, сейчас мы только напомним о его использовании всюду, где возникает обработка изображений: от редактирования фотографий на смартфоне – для размытия фона за объектом в режиме "портрет", до анализа рентгеновских снимков – чтобы убрать шум и улучшить читаемость изображения.

Читать далее

Threshold U-Net: как мы отказались от высокого разрешения и выиграли в скорости бинаризации

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели2.6K

Хоть современный ИИ уже почти в состоянии написать симфонию и превратить холст в шедевр, некоторые простые задачи все еще не так просты, если наложить ограничения на решение. Так как главной задачей у нас, в Smart Engines, является распознавание и оцифровка документов, то для нас ограничениями являются скорость работы и возможность запуска системы на вычислительно слабых конечных устройствах. В этой статье мы вспомним об одной классической задаче обработки изображений – бинаризации документов. А также расскажем, как нам удалось существенно оптимизировать нейросетевую модель бинаризации, сохранив исходное качество, и причем тут современные модели детекции текста.

Читать далее

BM YOLO: что, если вам не нужно умножать, чтобы распознавать?

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели5.4K

Современные технологии глубокого обучения проникают в самые разные области нашей жизни — от автономных автомобилей до систем видеонаблюдения. Однако высокая вычислительная сложность традиционных нейронных сетей остается серьёзным препятствием на пути к их широкому применению на мобильных устройствах и встраиваемых системах.

Группа исследователей из Smart Engines представила на международной конференции ICMV 2023 инновационное решение — биполярную морфологическую нейронную сеть YOLO (Bipolar Morphological YOLO, BM YOLO), которая сочетает в себе энергоэффективные вычислительные подходы и проверенную временем архитектуру YOLO для детектирования объектов.

Читать далее

Фильтр Гаусса на стероидах: секреты ускорения вычислений

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели12K

Привет, Хабр! Представьте, что вы пытаетесь обработать фотографию высокого разрешения на вашем смартфоне — добавить размытие, убрать шум или улучшить качество изображения. Кажется, задача проста, но за кулисами работает алгоритм, требующий немало вычислительных ресурсов. Речь идет о фильтре Гаусса – одной из самых популярных операций в области компьютерной обработки изображений.

Для каждого пикселя нужно выполнить множество операций сложения и умножения, особенно если размер фильтра велик. Это становится серьёзным препятствием, когда есть требования к работе в режиме реального времени, например, при обработке видео, адаптации для беспилотных летательных аппаратов и пр. Но что, если сказать, что такие вычисления можно ускорить в десятки раз с незначительной потерей качества?

Читать далее

Распознавание банковской карты для подтверждения личности

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели3.5K

В условиях стремительной цифровизации и активного развития дистанционных услуг подтверждение личности становится краеугольным камнем финансовых процессов. Задача быстрой и надежной идентификации уже день актуальна во всем мире. А сегодня мы поделимся с вами красивой идеей как можно с помощью современных технологий распознавания (на примере, естественно, продуктов Smart Engines) надежно реализовать автоматизированный процесс подтверждения личности без использования сторонних сервисов.

Читать далее

«Вы весь виски выпили?» — о чем говорили корифеи мира шахматных программ или как прошла ECAI-2024

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели3.7K

Три самолета, больше 12 часов в пути — и мы в Сантьяго-де-Компостела. Сюда выдающегося учёного и директора по науке Smart Engines Владимира Львовича Арлазарова пригласили выступить с небольшим докладом о том, как создавалась "Каисса". Хотите узнать, что ещё любопытного было на крупнейшей Европейской конференции по ИИ и причем тут виски? Заглядывайте под кат!

Причем тут виски??

Как мы перенесли распознавание на базе ИИ в веб и изменили веб-банкинг? А в Markswebb это оценили

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели3.1K

Привет, Хабр! Недавно аналитическое агентство Markswebb выкатило ежегодный рейтинг лучших веб-версий банковских приложений в 2024 году. Эксперты сравнили удобство и функциональность использования банковских услуг в браузере и выбрали банки с лучшими веб-приложениями по качеству клиентского опыта. Лидирующие позиции в обеих номинациях рейтинга - «Цифровой офис» (Digital Office) и «Цифровой банк для повседневных операций» (Daily Banking) - заняли наши клиенты!

Достичь крутых результатов удалось в том числе благодаря использованию систем распознавания Smart Engines. Рассказываем, как наши ИИ-решения помогли ведущим банкам поставить новые рекорды в сфере цифрового гостеприимства. 

Добро пожаловать!

Со вкусом ацетона: Как ИИ чуть не отравил программистов темным ПИВОМ

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели21K

Привет, Хабр! На связи Smart Engines с новым экспериментом. Помните, мы проверяли адекватность, реальность и убедительность советов искусственного интеллекта на примере рекомендаций светлого нефильтрованного пива? (Если не читали - бегом читать тут). Сегодня на очереди темное: выясним, что рекомендуют популярные нейросети и насколько выбор ИИ совпадает с человеческим.

В качестве подопытных кроликов - чат-боты от OpenAI, Яндекса и Сбера. В качестве независимого жюри, которому придется дегустировать пиво, - команда экспертов Smart Engines. Запасайтесь закусками, эксперименты начинаются!

Узнать подробности

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4.5K

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

Читать далее

Какое пиво любит ИИ? Что советуют популярные чат-боты и нравится ли это программистам

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели8.1K

Пусть прошлое раскрошитсяволною о причал, мы вспомним всё хорошее, забудем про печаль. Привет, Хабр! Сегодня поговорим о популярных чат‑ботах, их эффективности и… пиве! Кто‑кто, а уж за поводом выпить мы в Smart Engines в карман не полезем. На этот раз мы решили поддержать немецких коллег, устроить себе локальный Октоберфест, а заодно и протестировать известные нейросети: они будут помогать нам в выборе марок пива, а мы — проверять убедительность, реальность и адекватность их ответов.

Помните кейс про семью из Британии, отравившуюся грибами после прочтения пособия для грибников, написанного нейросетью? А что насчет жидкого золота?

Мы попросили генеративный ИИ от разных разработчиков составить свой топ-5 лучших видов светлого нефильтрованного пива. Нефильтрованного — в честь нашего нового Telegram‑канала «ИИ нефильтрованный». Вашему вниманию представляется пьеса в четырех частях. Главные герои: ChatGPT, Алиса Pro (она же YandexGPT), GigaChat от Сбера и команда независимых экспертов аналитического центра Smart Engines. 

Что было дальше?

Итоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели1.6K

В солнечных Афинах завершилась конференция ICDAR-2024. Причиной ли тому средиземноморское солнце или живой энтузиазм выступающих, но здесь было действительно жарко. Что неудивительно - ведь это главное международное мероприятие, посвященное вопросам распознавания. Одна из ключевых тем встречи – современные вызовы и перспективы OCR. Ведущие ученые со всего мира сошлись во мнении, что технологии распознавания жизненно необходимо сделать более понятными и интерпретируемыми. А для этого создать простую OCR явно недостаточно.

Нам в Smart Engines есть что добавить по этому поводу. Рассказываем, зачем нужно “объяснять” OCR и как это правильно сделать.

Объясняем тут
1
23 ...

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность