Для данных с масками и без использовалась одна и та же модель. Секрет успеха в том, чтобы обучать модель на данных, в которых есть картинки с масками. Тогда модель будет адекватно работать как на лицах с масками, так и без.
В статье мы показали, на что способен ПУБЛИЧНО доступный аллгоритм от Insightface, который есть у них в репозитории. Разумеется, у Insightface есть гораздо более мощные модели, которые и учавствуют в NIST FRVT, однако они не публичны.
Действительно, с ростом числа персон в базе поиска, увеличивается и вероятность ошибки алгоритма распознавания лиц. За цифрами можно обратиться к конкурсу NIST. Здесь в 3 и 4 столбцах мы имеем результаты для одного и того же домена, но при разном количестве персон в базе (N=12M и N=1.6М). Также можно нажать на название любого из алгоритмов в первом столбце, и на второй страничке отчета будет более детальный график зависимости точности от размера базы. Пример
Предельный размер базы, при которой еще возможно адекватное функцианирование системы, сильно зависит от условий съемки. Например в указанном выше отчете мы имеем дело с доменом Mugshot. Это, как правило, достаточно хорошие фотографии, сделанные в зафиксированных условиях. Домен метро, конечно, более сложный.
Стоит понимать, что у наивной системы распознавания лиц всегда будет ненулевая вероятность ошибки. Мне не известно как именно работает вся система face pay в метро, но возможно там используются (или будут использоваться в дальнейшем, когда размер базы станет большим) какие-то дополнительные трюки поверх распознавания лиц.
Для данных с масками и без использовалась одна и та же модель. Секрет успеха в том, чтобы обучать модель на данных, в которых есть картинки с масками. Тогда модель будет адекватно работать как на лицах с масками, так и без.
В статье мы показали, на что способен ПУБЛИЧНО доступный аллгоритм от Insightface, который есть у них в репозитории. Разумеется, у Insightface есть гораздо более мощные модели, которые и учавствуют в NIST FRVT, однако они не публичны.
Спасибо за отзыв)
В нашей команде также есть эксперты по lifeness, обязательно передадим им привет!
Действительно, с ростом числа персон в базе поиска, увеличивается и вероятность ошибки алгоритма распознавания лиц. За цифрами можно обратиться к конкурсу NIST. Здесь в 3 и 4 столбцах мы имеем результаты для одного и того же домена, но при разном количестве персон в базе (N=12M и N=1.6М). Также можно нажать на название любого из алгоритмов в первом столбце, и на второй страничке отчета будет более детальный график зависимости точности от размера базы. Пример
Предельный размер базы, при которой еще возможно адекватное функцианирование системы, сильно зависит от условий съемки. Например в указанном выше отчете мы имеем дело с доменом Mugshot. Это, как правило, достаточно хорошие фотографии, сделанные в зафиксированных условиях. Домен метро, конечно, более сложный.
Стоит понимать, что у наивной системы распознавания лиц всегда будет ненулевая вероятность ошибки. Мне не известно как именно работает вся система face pay в метро, но возможно там используются (или будут использоваться в дальнейшем, когда размер базы станет большим) какие-то дополнительные трюки поверх распознавания лиц.