Pull to refresh

Comments 54

А как работает корректировка при ошибке распознавания? "Гааля, у нас отмеена"?

В нашей системе есть несколько уровней самоконтроля. Система сообщает, когда не уверена в результате.

Человек не может вмешаться в ее работу.

Мой вопрос касательно ^^ вот этого в статье

В этих организациях есть специальная процедура, как исключение, направленная на исправление ошибок ввода паспортных данных.

А еслу уверена, но ей скормили лажу, что тогда?

Если система уверена, что ей скормили лажу, то она дает отказ

я обычно пессимист-теоретик, поэтому не воспринимайте мои слова как наезд.

1) у вас какие-то ограничения на использование конкретных мобильных устройств? Просто у меня уже было два смартфона средней цены после Lumia 640XL и все они по камерам хуже и хуже хотя и в мегапикселях больше, а вся беда в том что сейчас любимый формат съемки это "рыбий глаз" и куча постобработок для себяшек. Я банально не могу нормально сделать фото описания товара на упаковке чтобы прочитать состав или производителя, поэтому как там ваше ПО умудряется разглядеть что-то в паспорте?

2) Не рождает ли это проблему другого уровня - когда паспорт делается не под ввод руками, а под ваше ПО, которое (я гарантирую) имеет уязвимости.

3) Последний раз в банке был в декабре 2022 года, в сбере, но они никогда до этого и сейчас не сканировали паспорта, причем они даже не делают поиск по базе по номеру или снилс и не используют введенное ранее повторно, они тупо ВСЕГДА вбивают руками все данные из паспорта, а после этого прикрепляют сканы нужных страниц. И если не сбер, то кто без вас что-то сканировал из паспортов (никогда такое не видел) и кто те компании которые делают это силами вашей программы?

Хорошие вопросы — где гарантия что, грубо говоря, алгоритм определения подделок не утечет на сторону? Различного рода защиты программ говорят об обратном, даже страшно представит себе возможные последствия. Какая защита от подобного есть?
p.s. А так история разработки как хорошая книга, прочитал с удовольствием, очень интересно.

Гарантий нет, но к чему вопрос? Мол, не разрабатываете алгоритм определения подделок, а то утечёт? Подобный призыв нигде и никогда не сработал.

Нет, не к тому вопрос! Разработка классная во всех смыслах. Поэтому и вопросы безопасности должны быть на уровне, вот и интересно какими средствами решили, или предполагают решить эти вопросы

Алгоритм это Федеральный закон. Для этого достаточно скачать Консультант Плюс. Там расписаны эти две строчки кода.

Я знаю, что как минимум Тинькоф просто фоткает документы (ну и причина понятна - не будет же их курьев со сканером ездить по домам). Не знаю используют они это решение, или какое-то другое

Добрый день! Ниже ответы по порядку.

  1. Мы работаем на аппаратах из широкого ценового диапазона, например на INOY. Для нормального результата требуется камера не менее 5 МП, наличие автофокуса.

  2. Классическая проблема щита и меча. Конечно, все можно сломать. Мы постоянно совершенствуем наше решение.

  3. Сбер не наш клиент, за таким комментарием не к нам.

У Сбера домклик тоже быстро распознаёт паспорта, даже рукописные калографическим шрифтом с вензелями

Попробуйте снять лимон в качсе Сбер Первого, вам там все страницы проверят.

Разработка очень крутая. действительно полезная. Недавно обновлял онлайн паспортные данные в Тинькофф и Хоум Кредит и очень удивился тому как легко и быстро всё проходит. И отдельный искренний плюс вам в карму за посадку дубов!

Спасибо, приятно такое слышать от нашего пользователя!

А почему именно дубы? Они же очень медленно растут

Среди растущих в России деревьев дуб черешчатый является одним из лидеров по способности поглощать углекислый газ, а также довольно неприхотлив в посадке и уходе.

P.S. Дуб черешчатый живет 400 лет. Мы смотрим далеко в будущее!

Посмотрите через несколько лет, там все зарастёт осинами, берёзами и тп

Зато очень качественное дерево. Одно из лучших среди листопадных.

Живет, при хороших условиях, столетиями (есть множество рекордсменов живущих более тысячи лет), мощная корневая система, благодаря которой они не ветровальные, хорошо возобновляются при повреждениях, их желуди – отличная пища для птиц, которые в ответ помогают в размножении дубов (сойка делает большие запасы и часть из них прорастает). И они растут медленно только в первые годы, далее прирост может быть и до метра в год.

Ну так в первые годы их и забьёт поросль самосева, кустарники. Надо уход им большой

Будем надеяться, ребята из SmartEngine за ними присмотрят :-) Я, после того как сажаю дерево, обязательно пару раз в сезон приезжаю посмотреть, как оно, убрать сорняки и добавить долгоиграющих удобрений.

Хобби такое.

Нужен научный подход. Например, сажать смесь разных деревьев: сосны, которые прикроют дубы от забивания сорными кустами, а потом уступят им место. Монокультура это не всегда хорошо

Причина, по которой увеличилось количество дропов.

Жизнеспособен ли вариант сканирования только серийника и отправки запроса в паспортную базу данных? Ответ с полными данными только уполномоченному аккаунту. Для простых "проверяльщиков" отправляются распознанные данные и возвращается подтверждение корректности. Для предотвращения подбора брутфорсом отдельные меры (начиная с таймаутов).

А после распознования на телефоне куда данные отправляются ? или вы библиотеку предоставляете ?

Да, все верно. Наш продукт - это SDK, который встраивается уже в клиентское приложение банка и т.п.

Молодцы! Единственное что озадачивает в статье - начали с "можете себе представить менеджера с ноутбуком и сканером? конечно же нет" - закончили "программно-аппаратным решением", т.е. в общем то менеджером с ноутбуком и сканером :)

Фактически мы прошли весь путь: АРМа с планшетным сканером до сотрудника с планшетом. А специальный сканер - это о задаче проверки подлинности, которая сильно отличается от распознавания

а в чём, собственно, сложность разработки? любой студент второго курса информационного направления, хоть немного знакомый с МЛ, может создать подобную систему, имея достаточно данных для обучения и времени

Разговаривать - не перемещать грузы.

Любой студент второго курса, хоть немного знакомый с МЛ, знает о существовании теоремы об универсальном аппроксиматоре, которая гласит, что имея достаточное количество данных, можно решить почти любую задачу.

Совершенно удивительно, что до сих пор по всему миру существует огромное компаний и научных коллективов, решающих разными способами простейшие задачи компьютерного зрения и распознавания образов.

Подобную это какую? Распознавание машинописного паспорта? Возможно.

Но тут ведь задача немного другая, надо знать куда смотреть, где наиболее вероятно проявление подделки.

Дьявол в деталях. Сделать 80% можно из коробки. 90% - через год, обвесив коробочное решение костылями. 95% и выше - может вообще никогда не получиться, или.. туда нужно будет влить десятки человеко-лет, получив попутно уникальную экспертизу.

Кроме того, между in vitro и in vivo - огромная разница!

Чего только не придумают, что бы чип не вставлять. Есть же заграничные паспорта с чипом, работающим по стандартным всем известным протоколам. Почему на внутренних паспортах так же не сделать?

Даже если сейчас вставят чип, то все равно останется куча паспортов без него. А с чипом достаточно пластиковый карты

Чипы кончились в стране говорят.

Ну а в целом что мешает воткнуть в один паспорт чип от другого? Типа задача появляется по проверке по фотке чипа данным на печатанным на паспорте. А раз модель нарушителя такая, что не доверяют ручному вводу доверенного работника, то камеру включить для распознания букв придется.

То же что мешает предъявить чужой или поддельный паспорт. Не совпадение биометрии, подписи. Только в случае чипа не надо сверять рисунок по краям фотки и фотографировать под углом, анализируя тень, высчитывая вероятность того что была вклеена чужая фотка. Так как фотка, пальчики и радужка берётся с чипа и сверяет я с лицом, предьявившим чип.

Биометрию не извлечить из папорта, чего? Или вы про фото? Дак это не биометрия, это просто фото. Нет там никакой радужки, только пальчики и то с недавних пор.

Фото можно извлечь, биометрия это или нет вопрос дискуссионный и контекстозависимый.

Радужку, пальчики, ладонь итп не извлечь, но можно сверить, зная секретный ключ.

Записывают это в чип или нет, дело десятое.

Чипы не кончились, просто паспортами завален их кабинет, они не успевают отправлять. Ну и вообще ePassport надо в базах ООН регистрировать.

А где вы брали поддельные паспорта для тестов? На видео очень красивый муляж, кстати.

Муляж на видео взят из Википедии.

С такой качественной полиграфией? Удивительно. А вообще как вы выясняли какие наиболее частые механизмы подделки используются? Достаточно ли анализировать только "характерные особенности оформления документа и анализ результатов распознавания"? Или для ваших клиентов это избыточно?

Фирмы, которые работают с верификацией паспортов, хоть российские хоть иностранные, имеют порядочную подборку поддельных паспортов из структур типа МВД. Иначе как бы они свой софт делали :)

В статье уже описано, что для определения признаков подделки делается фото в видимом свете, УФ и ИК.

Сканеры (фотики) улучшаются, алгоритмы улучшаются, часто нужно для этого делать новые фото с реальных сэмплов.

Для Альфы ваша система у меня не сработала, не смогла распознать новый машинописный паспорт. Затык на странице с данными о предыдущих паспортах. Пришлось идти в офис банка.

Спасибо за фидбек, разберемся с интеграцией

У меня вообще на загране печать про старые паспорты почти без краски была, козлы.

Где можно подробнее про Радоновские слои почитать?

Верно понял, что у вас самописные алгоритмы обучения или вы какие-то фреймворки используете?

Добрый день!

У нас все самописное, мы регулярно публикуем статьи про наши алгоритмы здесь, на Хабре.

Про специальные сети с необычными слоями почитать можно здесь.

Каким образом исключение ручного ввода паспортных данных защищает от утечек?

Sign up to leave a comment.