Pull to refresh

Comments 8

Теперь я знаю точно, найти дубликат текстового документа в 100500 раз легче и быстрей.

Спасибо, очень познавательно.
Прикольно. Сам, когда только изучал php, столкнулся с похожей задачей, но тогда просто уменьшал изображения до 7x6 px и сравнивал потекстово через similar_text. Оказывается, был близок к истине =)
UFO landed and left these words here
UFO landed and left these words here
Жаль я не был на субботнике, а то задал бы вопрос «как поведёт себя ваш алгоритм, если взять N картинок из поиска и склеить их горизонтально/вертикально?» — думаю, такое он не определит.
То о чем говорите вы, это скорее критическое отклонение от центра кластера и алгоритм сработает правильно, не отнеся это изображение ни к одному классу или отнеся его к классу шума.
Интересно было бы узнать, как определяются похожие прямоугольные области на картинках-полудубликатах после выделения фич.
Интересно, а для нахождения дубликатов mp3 файлов есть какие то решения, может кто сталкивался?
Only those users with full accounts are able to leave comments. Log in, please.