sashacmc 21 янв 2021 в 02:15

Миллион домашних фотографий: лица, лица, лица

11 мин

17K

Python*Программирование*Обработка изображений*СофтИскусственный интеллект

+38

Комментарии 41

НЛО прилетело и опубликовало эту надпись здесь

sashacmc 21 янв 2021 в 10:20

Мне повезло в этом плане с доцифровой эпохи фотографий всего несколько тысяч, так что я их отсканировал и разложил по местам еще с появлением первых нормальных сканеров.

PereslavlFoto 21 янв 2021 в 13:29

В этом смысле очень удачным решением зачастую является Wikimedia Foundation. Загрузив ваши фотографии на Викисклад и разрешив всем свободно использовать их для произвольных целей, вы привлекаете большое сообщество к тому, чтобы опознать их сюжеты.

Конечно, это работает лишь с фотографиями, которые можно использовать без ограничений. То есть с фотографиями, где авторское право принадлежит вам, или с фотографиями, которые перешли в общественное достояние.

НЛО прилетело и опубликовало эту надпись здесь

nikkadim 21 янв 2021 в 03:55

CUDO --> CUDA, пожалуйста

НЛО прилетело и опубликовало эту надпись здесь

sashacmc 21 янв 2021 в 10:09

Если говорить о нахождении лиц, то в случае с CNN сложно сказать точные цифры.
Такое ощущение что находит в 100% (если не брать лица повернутые от камеры больше чем на 90). Специально пропущенные я не искал, а случайно не попадались. В первой тестовой (пара десятков групповых фото) выборке нашел все.
HOG около 97% фронтальных и совсем плохо если даже немного повернуты.

Если про кодировку, то алгоритм из face-alignment нормально отрабатывает на ~95% (но то, что не отрабатывает это в основном совсем шлак: не в фокусе, сильно перекрытые или отвернутые), все хорошие отрабатывают отлично.

Соответственно экспериментами с ЧБ не занимался, впрочем, не исключаю что внутри dlib оно само преобразуется, так как в моих экспериментах по работе непосредственно с сетками ЧБ работает лучше.

НЛО прилетело и опубликовало эту надпись здесь

sashacmc 21 янв 2021 в 21:47

Просто лицо.
А дальше очень сильно зависит от того, сколько образцов, насколько отличаются люди и какие выставлены пороги для погрешностей.
В моем случае (когда уже обработаны фотографии за несколько лет и добавлено большое количество образцов), если сейчас взять абсолютно новые фотографии тех людей, что уже есть в системе, то около 90% определяется верно.

НЛО прилетело и опубликовало эту надпись здесь

sashacmc 21 янв 2021 в 22:23

Ну это уже дело системы просмотра фотографий. А у меня была задача добавить в нее теги, чтобы искать по лицам.

PaulZi 21 янв 2021 в 09:09

Не пробовали это, работает вроде шустро и без видеокарты есть демо в браузере:
https://justadudewhohacks.github.io/face-api.js/docs/index.html
А так старая добрая picasa все ещё может работать и все делать из коробки)

sashacmc 21 янв 2021 в 10:16

Не пробовали это, работает вроде шустро и без видеокарты есть демо в браузере:

Не пробовал, но там, судя по беглому описанию, тот же dlib под капотом.

PaulZi 21 янв 2021 в 10:25

Но вот в демо я подгружаю свои фотки, и всё распознаётся за несколько секунд на не самом мощном железе.

sashacmc 21 янв 2021 в 10:34

Попробовал. Упс.
Ну т.е. оно работает, да, но лица в профиль мимо.
Собственно все проблемы у меня из-за того, что я решил лица в профиль тоже распознавать.

leremin 21 янв 2021 в 09:17

Что-то я не очень понял. Picasa, например, на древнем Core 2 Duo и 2 Gb Ram весьма бодро лица искала и группировала…

sashacmc 21 янв 2021 в 10:13

А вы уверены, что были найдены все лица, а не только фронтальные?
Большинство программ просто ищет по фото, а не подсвечивает лица, поэтому увидеть что было пропущено весьма непросто.
Ну и плюс сгруппировать и сопоставить все группы одному человеку с этим пока даже гугл-фото весьма и весьма лажает.

AcckiyGerman 21 янв 2021 в 10:23

Для желающих рассортировать свой каталог фотографии по лицам (и местам и другим другим категориям), но не желающим для этого разбираться в нейронных сетях или сливать личную информацию в Гугл/Эппл -

Попробуйте synology moments.
То же фото-облако, только на вашем собственном железе. Я был полностью удовлетворен.

impwx 21 янв 2021 в 12:15

Уже вот-вот выйдет DSM 7, в котором приложения Photo Station и Moments полностью переделаны и совмещены в одно

sashacmc 21 янв 2021 в 12:32

А я правильно понимаю, что оно работает только на их фирменном и весьма недешевом железе?

impwx 21 янв 2021 в 18:47

Есть бесплатный опенсорсный порт их софта — XPEnology. Да-да, название придумано русскими :)

Однако после полугода использования Synology DS920+ могу сказать, что качество железа и удобство работы более чем оправдывает его стоимость.

HenryPootle 22 янв 2021 в 13:14

Если для DSM7 смогут сделать загрузчик, то на условно произвольном железе тоже будет работать. Гуглить XPEnology

wtigga 21 янв 2021 в 21:05

Я пришёл в эту публикацию потому что знал, что в комментариях кто-то подскажет готовое решение для ленивых. Большое спасибо! Теперь есть чем занять свою домашнюю DSку.

drWhy 21 янв 2021 в 10:24

«Лица, лица, лица...»
В общем-то, неплохой вариант. Было предложение авторизировать пользователей ватер-клозета по индивидуальному рисунку складок, оказывается они более уникальны, чем черты лица.

-1

НЛО прилетело и опубликовало эту надпись здесь

saintbyte 21 янв 2021 в 10:40

в postgres есть уже давно такой тип как CUBE — в идеально хранятся матрицы с лицами. Потом можно одним запросом находить самые похожие лица. Вообще я 2 года назад сделал на этой же библиотеке поисковик по фейсам за 2 секунду по 300к фейсам с википедии искала на довольно плохом хостинге.

sashacmc 21 янв 2021 в 12:41

Спасибо. Про CUBE знаю, но не хотелось привязываться к «взрослой» СУБД. Да и скорость поиска тут не важна, он только на этапе подготовке данных и на фоне остальных операций крайне незначительно времени занимает. А в основном режиме работы поиск идет только по тегам, а это вообще не требует ничего специфического.

estet 21 янв 2021 в 17:04

Спасибо за статьи.

Тоже интересовался темой, потому что не хочу выкладывать фотографии в облако.
Нашёл opensource приложение на Go PhotoPrism, которое умеет распознавать объекты на фотографиях (TensorFlow) и web-ui для просмотра и поиска фотографий. Есть демо — demo.photoprism.org/browse

В случае работы на Mac OS задача облегчается тем, что все модели для распознавания объектов на фотографиях уже есть в ОС и с приложением osxphotos можно разметить свои фотографии, метаинформацию хранить в sqlite. Вот еще занимательная статья про то, как найти лучшую фотографию с пеликаном.

Интересно, может где-то есть обученные модели распознавания предметов и животных в открытом доступе?

AmberSP 21 янв 2021 в 17:12

PhotoPrism плохонько работает. Чёрную кошку распознал только на трёх фото из нескольких десятков, хлебушек счёл портретом и так далее. там под капотом NasNet, SOTA 2017 Года: accuracy of 82.7% top-1 and 96.2% top-5 on ImageNet.

estet 21 янв 2021 в 17:35

Почему так? Модели не очень?

sashacmc 21 янв 2021 в 17:21

Спасибо за ссылку, посмотрю.
Довольно большой каталог датасетов для создания различных моделей можно найти тут www.tensorflow.org/datasets/catalog/overview?hl=en
Насчет уже обученных моделей не подскажу, не приступал еще к этой задаче.

acklamterrace 21 янв 2021 в 18:28

pypi.org/project/face-recognition – вполне ок. Я вставил ее в свой самописный iPhoto, она за 1-2 дня обработала тысяч сорок фоток на дохленьком двухядерном Celeron 1.6GHz. Главное было обрабатывать scaled фотки, а не оригиналы 6000x4500px (разницы в точности я не заметил).

Главной проблемой оказалось не найти лица, а корректно идентифицировать людей, с учетом того, что это семейный архив, и условная Маша в 2020 году очень похожа на бабушку Клаву в 1925 :-)

sashacmc 21 янв 2021 в 19:52

Подозреваю что вы использовали ее с настройками по умолчанию, значит с HOG, он да, на CPU вполне норм идет.

Главной проблемой оказалось не найти лица, а корректно идентифицировать людей, с учетом того, что это семейный архив, и условная Маша в 2020 году очень похожа на бабушку Клаву в 1925 :-)

Значит вы ощутили всю мою боль! :)

НЛО прилетело и опубликовало эту надпись здесь

sashacmc 21 янв 2021 в 21:49

Думал добавить, правда руки так и не дошли.
Но добавил отображение года в интерфейс проверки качества, очень помогает.

SthPhoenix 21 янв 2021 в 19:28

Сейчас для поиска и распознавания лиц существуют более продвинутые библиотеки, например https://github.com/deepinsight/insightface.

Правда для быстрой работы GPU уже просто необходимы. С некоторыми оптимизациями сетки по ссылке выше можно запускать на видеокартах GTX 1080 на скоростях около 70-90 кадров в секунду

sashacmc 21 янв 2021 в 19:55

Выглядит интересно! Посмотрю, спасибо.

SthPhoenix 22 янв 2021 в 09:12

Если будет интересно попробовать, у меня на гитхабе есть докеризованная версия обернутая в FastAPI и сконвертированная в TensorRT для повышения производительности: https://github.com/SthPhoenix/InsightFace-REST