Конфигурация 1С «Поиск дублей файлов».
Ссылка для скачивания конфигурации "Поиск и удаление дублей"
Назначение:
Предназначена для автоматического поиска и удаления одинаковых файлов на компьютере.
Возможности и преимущества перед остальными подобным инструментами:
1) Выполнять поиск можно как по выбранным папкам, так и по целым томам жестких дисков и съемных носителей.
2) Поиск выполняется по хеш-сумме файла, таким образом можно однозначно определить дубль файла, даже если он был переименован.
3) Перед поиском доступна расширенная настройка – можно указать, файлы каких расширений требуется найти, можно выбрать по типу файлов: фото, видео, документы, архивы, образы, файлы 1С и т.п.
4) Вся отобранная информация о найденных файлах записывается в регистр сведений – можно один раз отобрать, и повторно использовать эту информацию в отчете или обработке.
5) Отчет "Одинаковые файлы" выводит информацию о дублях, сгруппированную по размеру файлов и контрольной сумме. Удобно разбирать большие файлы, которые много "весят": образы, фильмы и т.п.
6) Обработка «удаление дублей» - позволяет в удобном виде просматривать информацию о дублях и массово удалять их: она выводит «пересечения» между папкой1 и папкой2 в которых находятся одинаковые файлы. Есть возможность массово удалять все задубленные файлы из выбранной папки, причем можно выбрать, какую папку мы считаем основной, а какую – задубленной. Удаляемые файлы можно перед удалением перемещать в корзину (кроме USB носителей). Можно открывать папки и файлы по двойному нажатию мыши. В обработке предусмотрена защита от полного удаления "уникального" файла - если в корреспондирующей папке уже удалили файл, то она не даст удалить файл во основной папке.
Порядок проверки:
1) Скачиваете конфигурацию, разворачиваете, запускаете.
2) Выполняете обработку «Поиск дублей.
3) Отчетом «Одинаковые файлы» оцениваете масштабы, можно точечно удалить объемные файлы.
3) Обработкой «Удаление дублей» массово удаляете дубли файлов.
Описание и пример проверки.
У нас есть 5 папок, в которых есть дубли файлов:
1) C:\Море 2024
2) C:\Море 2024\Оригиналы
3) C:\Поход в лес
4) D:\Флешка Гриб и лес для Пети
5) E:\Обои на рабочий стол
Папки находятся в 2х томах и на флешке:
1) Диск С
2) Диск D - USB флешка
3) Диск Е
Файл "Заказ" читаем как "Закат", опечатка :) В папке "Море 2024" находятся 3 морских фото и папка "Оригиналы":

В папке "Оригиналы" лежат аналогичные 3 фото моря:

В папке "Поход в лес" находятся 2 фотки из леса:

В папке "Флешка Гриб и лес для Пети" лежат 2 фотки из леса

В папке "Обои на рабочий стол" лежат все файлы, кроме "Гриба", грибу место на сковородке, а не на рабочем столе !!! :)

Запускаем обработку "Поиск дублей":
Выбираем указанные папки, выбираем расширение "JPG", нажимаем кнопку "Отобрать дубли файлов".
Примечание: в примере приведены только несколько папок.
Обычно будут выбираются все тома жестких дисков компьютера + можно флешки.
В обработке можно указывать минимальный размер файла в МБ, который будет отобран для поиска дублей. Полезно указывать от 0,15 Мб, что бы исключить все мелкие пиктограммы.

Примечание: есть возможность выполнять поиск по определенной группе файлов, например по видео-файлам, например вот так:

После завершения обработки поиска дублей файлов, заполняется регистр "Найденные файлы", в нашем примере он выглядит так (в данном регистре так же удобно смотреть файлы, отсортировав их по "Размер МБ") :

Формируем отчет "Одинаковые файлы", в нём видно, что уникальных файлов у нас 5 шт., внутри группировок пути, по которым лежат дубли. Этим отчетом удобно разбирать вручную "объемные" файлы.

В случаях, когда дублей много (например с фото), удобно обрабатывать дубли "массово", для этого используем обработку "Удаление дублей", так выглядит группировка верхнего уровня, показывает "пересечение" по задубленным файлам между папками с выводом количества одинаковых файлов в обеих папках:

Развернутый вариант дерева обработки выглядит так:
При двойном клике мышкой на папке или файле - они открываются.
Влево встаёт каталог, в котором больше задубленных файлов. Сортируется по названию каталога, для удобства обработки.

Далее возможны 2 варианта обработки файлов (решение принимает пользователь):
1) Соглашаемся, что зеленый каталог - это верный, и нам нужно удалить все файлы из желтых каталогов.
2) Верный каталог - один из желтых, тогда нам нужно удалить файлы из зеленого и остальных желтых.
Привожу пример первого сценария, когда зеленый - это правильный каталог.
Выбираю ячейку с папкой "C:\Море 2024" + нажимаю "Удалить выделенные файлы"
Выбираю ячейку с папкой "C:\Море 2024\Оригиналы" + нажимаю "Удалить выделенные файлы"
Получаю:

Привожу пример защиты от ошибочного удаления: если я выделю зеленую ячейку "Море.jpg" и нажму "Удалить выделенные файлы", программа не даст мне этого сделать, т.к. удалится уникальный файл. Аналогично программа не даёт удалить файлы, когда мы выделяем каталог и удаляем из него.

В результате, на данный момент мы оставили файлы "Море + Заказ + Город" только в каталоге "E:\Обои на рабочий стол", а в двух других каталогах мы дубли удалили.
Нажимаем "Заполнить дерево", дерево обновилось, пересечений дублей по 3-м "морским" файлам не осталось:

Примечание: когда флаг физического удаления снят, появляется такой вопрос:

А когда флаг физического удаления установлен, то выделяется жирным, для привлечения внимания:

Важная особенность удаления со сменных носителей USB - удаляемые файлы нельзя поместить в корзину, они удаляются сразу. Тут уже вопрос задаёт сам Windows. Для пример, я выделю каталог "D:\Флешка Гриб и лес для Пети" и нажму "Удалить выделенные файлы":

Выбираю "да", затем обновляю дерево "Заполнить дерево", остаётся пересечение по одному файлу "лес", выбираю зеленый файл, удаляю:
Обратите внимание, если каталоги были в "желтом" столбце "Каталог2" на предыдущем фото, то после обновления они сопоставились между собой:

Обновляю дерево, пересечений нет:

В регистре сведений "Найденный файлы" при удалении файлов - удаляются соответствующие записи, в итоге у нас осталось 5 записей в регистре:

Привожу пример второго сценария, когда один из желтых - это правильный каталог.
Я считаю, что нельзя программе полностью доверять автоматическое удаление файлов, т.к. часто бывает, что дубли нужно оставлять: например, когда мы долго выбираем лучшие фото в отдельную папку, обидно будет их потерять при автоматическом удалении.
Поэтому я оставил для пользователя выбор, из какой папки нужно удалять дубли, и нужно ли вообще их удалять. Исходное дерево:

Пусть верным каталогом "морских" фото будет "C:\Море 2024\Оригиналы"
Выбираю ячейку с папкой "C:\Море 2024" + нажимаю "Удалить выделенные файлы".
Получаю:

Выбираю ячейку с папкой "E:\Обои на рабочий стол" + нажимаю "Удалить выделенные файлы".
В итоге 3 фото удаляются из папки "E:\Обои на рабочий стол", а в дереве очищаются файлы сразу в 6-ти ячейках, обратите внимание:

Обновляю дерево, нажимаю кнопку "Заполнить дерево", получаю оставшиеся дубли, дубли "морских" фото исправлены, их не выводит:

В регистре сведений "Найденные файлы" осталось 3 уникальных "морских" фото:

Пожалуй, это всё.
Буду рад обратной связи.
Запускайте проверку в толстом клиенте - так быстрей. Файлы картинок на моём винчестере 1,5 тб отбираются около 1 часа, правда и фоток у меня много.
При помощи обработки, на данный момент я освободил 150 Гб, в основном это видео.
Код открытый.
Маски файлов прописываются прямо в коде, их можно дополнять в конфигураторе, либо в режиме предприятия - у формы стоит сохранение настроек.
Всем летнего настроения !
Ссылка для скачивания конфигурации "Поиск и удаление дублей"
Конкурс, среди скачавших на инфостарте:
Первому, кто отгадает в комментариях на инфостарте все 3 места на фото ниже (Краснодарский край) - тому я добавлю вознаграждение 5 SM в ответе.
Фотки в студию !!!


