Комментарии 9
То есть модель научилась различать прямая съемка vs съемка экрана. Правда дальше вы упоминаете фото (стоит уточнить профессиональное фото или распечатка джипега)
Модель обучилась контролировать: Муар от пикселей экрана. Искажения цветопередачи. Характерные блики. Неестественные градиенты освещения.
Полагаю закроет 90% атак. Вот только с фото бы разобраться.
Ну ок, допустим я мошенник, это мой бизнес, мой заработок, я же не буду использовать кривой монитор, а возьму 8к OLED телевизор с матовым экраном)
Я правильно понял, что если распечатать фото на хорошем принтере и сфоткать, то вы это не задетектите, потому что обучились только на экраны?)
@Kamil_GR @ivazhu отвечу сразу одним комментом)
Собрать вручную датасет с распечаткой большая проблема, те модели что мы уже нашли работают с ней достаточно хорошо (проверяли на CelebaSpoof), нашей же задачей было покрыть самый популярный и ожидаемый вид атак через использования дисплея.
Чтобы добиться более стабильной работы на всех вариантах спуфов нужно уже смотреть на варианты такие как ИК и стерео камеры – и это уже в планах на будущее)
Ну т.е. ответ на мой вопрос «да, спуф пройдёт». Тогда не понятно, зачем вы это делали. Если бы это была курсовая работа, то ок, норм работа. Но на диплом уже не тянет, потому что существует очевидная дыра, которая никак не закрыта.
Более интересный вопрос с точки зрения бизнеса - зачем было тратить столько денег на незаконченный рисеч, если можно было бы купить продукт профессионалов. Не реклама, но idrnd и по одному кадру без всяких подсветок работает так, что вам потребуется очень много времени, чтобы их решение заспуфить. И да, они собирали базы, которые «собрать вручную большая проблема»
@Alex-Freemanrandomsimplenumber
Анти-спуфинг сделан для КПП, куда большой монитор пронести весьма проблематично))
Также и виртуальную камеру не подключишь, используется только наша камера внутри приложения.
И вот кто-то такие системы называет Face ID, хотя Face ID это конкретная система, разработанная Apple и находящаяся на недосягаемом уровне, по сравнению вот с такими вероятностными штуками.
Что мешает снимать ДВА кадра с небольшим промежутком времени (порядка секунды) и сравнивать их? Если это живое лицо, кадры обязательно будут хоть немного, но отличаться, это по идее распознать в разы проще, чем артефакты от экрана.
Один кадр против спуфинга: как мы определяем фейковые лица без видео и биометрии