Pull to refresh

Comments 3

Всем привет, автор здесь. Вижу, что статью читают - уже 90 просмотров за 2 часа!
Но пока тишина в комментариях.

Старался сделать акцент на технической стороне, миграции legacy-проектов и потенциальной пользе. Если есть конкретные вопросы - с радостью отвечу!

Давайте запустим дискуссию:

• Кто уже сталкивался с проблемой дубликатов файлов?
• Если да, какие решения пробовали до этого?
• Есть ли опыт миграции legacy-хранилищ?

А можно ли подобное сделать, но только не с названием файлов / их путями, а с содержимым. Мне кажется, такой метод был бы куда эффективней. Так как названия файлом могут быть разными, но сами по себе одинаковыми.

Есть ли в PHP возможность открыть файл и получить sha/md5? Если я не ошибаюсь, то есть уже подобные программы, да и в торрентах они используются.

Конечно можно, более того, Dedupler работает именно по содержимому файлов, а не по их названиям или путям.

Конкретный пример:

- отчет_васи.pdf (SHA1: 123abc...)

- отчет_васи_который_переслал_петя_без_правок.pdf (SHA1: 123abc...)

Результат: Один физический файл в хранилище

Sign up to leave a comment.

Articles