Как стать автором
Обновить

MIDV-2020: как мы создали крупнейший датасет  документов, удостоверяющих личность

Время на прочтение8 мин
Количество просмотров4.2K
Всего голосов 4: ↑4 и ↓0+4
Комментарии8

Комментарии 8

Лица на фотографиях слишком радостные и красивые. Я бы не поверил такому документу

И совершенно правильно сделаете, потому что это искусственно созданные документы. Для них мы взяли искусственно созданные лица. Как вы справедливо заметили, все они действительно радостные и красивые. Возможно, в этот день генератор искусственных лиц был в хорошем настроении)

Как например binance реагирует на регистрацию с таким сгенерированным документом? Как получить доступ к вашему генератору по подписке?

а действительно - "распознавательная часть" системы обработки документов еще под вопросом, но "генеративная часть" - уже огого!

PS: по идее - сравнительно несложно сделать свой собственный генератор: ссылка на https://generated.photos/faces есть, генераторы имен и подписей тоже можно найти, немного скриптов фотошопа и вуаля

Еще раз подчеркиваем: стенд создан исключительно для научных целей!

да да, мы всё поняли :)

вы забыли еще добавить "программа на питоне была написана моим другом, исходный код он потерял, извините - не можем" /s

Посмотрел разметку российских паспортов. Нашел только поля face и doc_quad. Вы пишите, что еще есть signature и текстовые поля. Куда-то не туда смотрю?

Кстати, в примере разметки в статье тоже только два поля: face и doc_quad

На каждом кадре видео размечен бокс овала лица и координаты четырехугольника документа, а также по именованию клипа восстанавливается идентификатор самого документа. В архиве templates для каждого уникального документа размечены реквизиты с их координатами относительно документа - соответственно, восстанавливаются и координаты каждого обьекта на каждом кадре.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий