Только сейчас комментарий заметил. Мак это конечно не плохо, вот только вся коллекция почти 10Tb, такой мак еще поискать надо. Ну и на счет "постоянно как и система", 10 лет назад мак был не такой как сейчас, а система каталогов уже лет 30 без изменений.
Просто лицо.
А дальше очень сильно зависит от того, сколько образцов, насколько отличаются люди и какие выставлены пороги для погрешностей.
В моем случае (когда уже обработаны фотографии за несколько лет и добавлено большое количество образцов), если сейчас взять абсолютно новые фотографии тех людей, что уже есть в системе, то около 90% определяется верно.
Подозреваю что вы использовали ее с настройками по умолчанию, значит с HOG, он да, на CPU вполне норм идет.
Главной проблемой оказалось не найти лица, а корректно идентифицировать людей, с учетом того, что это семейный архив, и условная Маша в 2020 году очень похожа на бабушку Клаву в 1925 :-)
Спасибо за ссылку, посмотрю.
Довольно большой каталог датасетов для создания различных моделей можно найти тут www.tensorflow.org/datasets/catalog/overview?hl=en
Насчет уже обученных моделей не подскажу, не приступал еще к этой задаче.
Спасибо. Про CUBE знаю, но не хотелось привязываться к «взрослой» СУБД. Да и скорость поиска тут не важна, он только на этапе подготовке данных и на фоне остальных операций крайне незначительно времени занимает. А в основном режиме работы поиск идет только по тегам, а это вообще не требует ничего специфического.
Попробовал. Упс.
Ну т.е. оно работает, да, но лица в профиль мимо.
Собственно все проблемы у меня из-за того, что я решил лица в профиль тоже распознавать.
Мне повезло в этом плане с доцифровой эпохи фотографий всего несколько тысяч, так что я их отсканировал и разложил по местам еще с появлением первых нормальных сканеров.
А вы уверены, что были найдены все лица, а не только фронтальные?
Большинство программ просто ищет по фото, а не подсвечивает лица, поэтому увидеть что было пропущено весьма непросто.
Ну и плюс сгруппировать и сопоставить все группы одному человеку с этим пока даже гугл-фото весьма и весьма лажает.
Если говорить о нахождении лиц, то в случае с CNN сложно сказать точные цифры.
Такое ощущение что находит в 100% (если не брать лица повернутые от камеры больше чем на 90). Специально пропущенные я не искал, а случайно не попадались. В первой тестовой (пара десятков групповых фото) выборке нашел все.
HOG около 97% фронтальных и совсем плохо если даже немного повернуты.
Если про кодировку, то алгоритм из face-alignment нормально отрабатывает на ~95% (но то, что не отрабатывает это в основном совсем шлак: не в фокусе, сильно перекрытые или отвернутые), все хорошие отрабатывают отлично.
Соответственно экспериментами с ЧБ не занимался, впрочем, не исключаю что внутри dlib оно само преобразуется, так как в моих экспериментах по работе непосредственно с сетками ЧБ работает лучше.
В моем случае так не выйдет. Как уже писал выше у каждого свое представление от том, какая фотография хорошая, а какая нет. Мы с женой например не сходимся во мнении, на этот счёт, поэтому договорились, что каждый свои фотографии только сам отбирает.
Только сейчас комментарий заметил.
Мак это конечно не плохо, вот только вся коллекция почти 10Tb, такой мак еще поискать надо. Ну и на счет "постоянно как и система", 10 лет назад мак был не такой как сейчас, а система каталогов уже лет 30 без изменений.
Не прошло и два года, как дошли руки допилить установку через pypi
https://pypi.org/project/photo-importer/1.2.0/
Заодно появилась поддержка Windows и MacOS и всякие другие мелкие улучшения.
Нет, у меня просто обычный сервер на базе Ubuntu Server
Но добавил отображение года в интерфейс проверки качества, очень помогает.
А дальше очень сильно зависит от того, сколько образцов, насколько отличаются люди и какие выставлены пороги для погрешностей.
В моем случае (когда уже обработаны фотографии за несколько лет и добавлено большое количество образцов), если сейчас взять абсолютно новые фотографии тех людей, что уже есть в системе, то около 90% определяется верно.
Значит вы ощутили всю мою боль! :)
Довольно большой каталог датасетов для создания различных моделей можно найти тут www.tensorflow.org/datasets/catalog/overview?hl=en
Насчет уже обученных моделей не подскажу, не приступал еще к этой задаче.
Попробовал. Упс.
Ну т.е. оно работает, да, но лица в профиль мимо.
Собственно все проблемы у меня из-за того, что я решил лица в профиль тоже распознавать.
Не пробовал, но там, судя по беглому описанию, тот же dlib под капотом.
Большинство программ просто ищет по фото, а не подсвечивает лица, поэтому увидеть что было пропущено весьма непросто.
Ну и плюс сгруппировать и сопоставить все группы одному человеку с этим пока даже гугл-фото весьма и весьма лажает.
Такое ощущение что находит в 100% (если не брать лица повернутые от камеры больше чем на 90). Специально пропущенные я не искал, а случайно не попадались. В первой тестовой (пара десятков групповых фото) выборке нашел все.
HOG около 97% фронтальных и совсем плохо если даже немного повернуты.
Если про кодировку, то алгоритм из face-alignment нормально отрабатывает на ~95% (но то, что не отрабатывает это в основном совсем шлак: не в фокусе, сильно перекрытые или отвернутые), все хорошие отрабатывают отлично.
Соответственно экспериментами с ЧБ не занимался, впрочем, не исключаю что внутри dlib оно само преобразуется, так как в моих экспериментах по работе непосредственно с сетками ЧБ работает лучше.
habr.com/ru/post/537684/#comment_22561960