Как стать автором
Обновить

Найти за полсекунды: сравниваем похожие фотографии

Время на прочтение10 мин
Количество просмотров24K
Всего голосов 40: ↑39 и ↓1+52
Комментарии7

Комментарии 7

С второй половиной все ок (хранение/кластер/сравнение, и.т.д.).

А вот с первой вы что-то намудрили. Это (sift,orb,Akaze, FAST,...) алгоритмы 10-летней давности. Сейчас много что поновее есть. Можно и нейросетевые дескрипторы брать. Но в целом, конечно, такие задачи скорее через формирование правильных embedding решаются. Чтобы не делать этого жесткого матчинга.

Расскажите - куда читать про то, как это делать правильно?

Во-первых, я пришел к выводу, что если у фото меньше 10 ключевых точек, то это, как правило, очень низкокачественные изображения. Их я просто отбрасывал, помечая как некачественные. 

Имеются примеры таких изображений? Насколько они некачественные? На них и человек ничего бы толком не увидел?

Неужели не видели эту статью?

«Выглядит похоже». Как работает перцептивный хэш

https://habr.com/ru/post/120562/

Супер быстрый алгоритм, за миллисекунды отрабатывает. И поиск потом уже по базе хэшей.

Эм. Он неустойчив к обрезанию, к повороту, к добавлению надписей, отвратительная стойкость к ложным срабатываниям. Уж лучше гистограммы сравнивать.

А насколько эта реализация устойчива к повороту не на 90 градусов и к перспективным искажениям?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий