Комментарии 8
Теперь я знаю точно, найти дубликат текстового документа в 100500 раз легче и быстрей.
Спасибо, очень познавательно.
Спасибо, очень познавательно.
Прикольно. Сам, когда только изучал php, столкнулся с похожей задачей, но тогда просто уменьшал изображения до 7x6 px и сравнивал потекстово через similar_text. Оказывается, был близок к истине =)
Жаль я не был на субботнике, а то задал бы вопрос «как поведёт себя ваш алгоритм, если взять N картинок из поиска и склеить их горизонтально/вертикально?» — думаю, такое он не определит.
Интересно было бы узнать, как определяются похожие прямоугольные области на картинках-полудубликатах после выделения фич.
Интересно, а для нахождения дубликатов mp3 файлов есть какие то решения, может кто сталкивался?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Кластеризация дубликатов в Яндекс.Картинках