Конфигурация 1С «Поиск дублей файлов».

Ссылка для скачивания конфигурации "Поиск и удаление дублей"

Назначение:
Предназначена для автоматического поиска и удаления одинаковых файлов на компьютере.

Возможности и преимущества перед остальными подобным инструментами:

1) Выполнять поиск можно как по выбранным папкам, так и по целым томам жестких дисков и съемных носителей.

2) Поиск выполняется по хеш-сумме файла, таким образом можно однозначно определить дубль файла, даже если он был переименован.

3) Перед поиском доступна расширенная настройка – можно указать, файлы каких расширений требуется найти, можно выбрать по типу файлов: фото, видео, документы, архивы, образы, файлы 1С и т.п.

4) Вся отобранная информация о найденных файлах записывается в регистр сведений – можно один раз отобрать, и повторно использовать эту информацию  в отчете или обработке.

5) Отчет "Одинаковые файлы" выводит информацию о дублях, сгруппированную по размеру файлов и контрольной сумме. Удобно разбирать большие файлы, которые много "весят": образы, фильмы и т.п.

6) Обработка «удаление дублей» - позволяет в удобном виде просматривать информацию о дублях и массово удалять их: она выводит «пересечения» между папкой1 и папкой2 в которых находятся одинаковые файлы. Есть возможность массово удалять все задубленные файлы из выбранной папки, причем можно выбрать, какую папку мы считаем основной, а какую – задубленной. Удаляемые файлы  можно перед удалением перемещать в корзину (кроме USB носителей). Можно открывать папки и файлы по двойному нажатию мыши. В обработке предусмотрена защита от полного удаления "уникального" файла - если в корреспондирующей папке уже удалили файл, то она не даст удалить файл во основной папке.

Порядок проверки:
1) Скачиваете конфигурацию, разворачиваете, запускаете.
2) Выполняете обработку «Поиск дублей.
3) Отчетом «Одинаковые файлы» оцениваете масштабы, можно точечно удалить объемные файлы.
3) Обработкой «Удаление дублей» массово удаляете дубли файлов.

Описание и пример проверки.

У нас есть 5 папок, в которых есть дубли файлов:
1) C:\Море 2024
2) C:\Море 2024\Оригиналы
3) C:\Поход в лес
4) D:\Флешка Гриб и лес для Пети
5) E:\Обои на рабочий стол

Папки находятся в 2х томах и на флешке:
1) Диск С 
2) Диск D - USB флешка 
3) Диск Е

Файл "Заказ" читаем как "Закат", опечатка :) В папке "Море 2024" находятся 3 морских фото и папка "Оригиналы":

В папке "Оригиналы" лежат аналогичные 3 фото моря: 

В папке "Поход в лес" находятся 2 фотки из леса:

В папке "Флешка Гриб и лес для Пети" лежат 2 фотки из леса

В папке "Обои на рабочий стол" лежат все файлы, кроме "Гриба", грибу место на сковородке, а не на рабочем столе !!! :)

Запускаем обработку "Поиск дублей":
Выбираем указанные папки, выбираем расширение "JPG", нажимаем кнопку "Отобрать дубли файлов".
Примечание: в примере приведены только несколько папок.
Обычно будут выбираются все тома жестких дисков компьютера + можно флешки.
В обработке можно указывать минимальный размер файла в МБ, который будет отобран для поиска дублей. Полезно указывать от 0,15 Мб, что бы исключить все мелкие пиктограммы.

Примечание: есть возможность выполнять поиск по определенной группе файлов, например по видео-файлам, например вот так:

После завершения обработки поиска дублей файлов, заполняется регистр "Найденные файлы", в нашем примере он выглядит так (в данном регистре так же удобно смотреть файлы, отсортировав их по "Размер МБ") :

Формируем отчет "Одинаковые файлы", в нём видно, что уникальных файлов у нас 5 шт., внутри группировок пути, по которым лежат дубли. Этим отчетом удобно разбирать вручную "объемные" файлы.

В случаях, когда дублей много (например с фото), удобно обрабатывать дубли "массово", для этого используем обработку "Удаление дублей", так выглядит группировка верхнего уровня, показывает "пересечение" по задубленным файлам между папками с выводом количества одинаковых файлов в обеих папках:

Развернутый вариант дерева обработки выглядит так:
При двойном клике мышкой на папке или файле - они открываются.
Влево встаёт каталог, в котором больше задубленных файлов. Сортируется по названию каталога, для удобства обработки.

Далее возможны 2 варианта обработки файлов (решение принимает пользователь):
1) Соглашаемся, что зеленый каталог - это верный, и нам нужно удалить все файлы из желтых каталогов.
2) Верный каталог - один из желтых, тогда нам нужно удалить файлы из зеленого и остальных желтых.

Привожу пример первого сценария, когда зеленый - это правильный каталог.
Выбираю ячейку с папкой "C:\Море 2024" + нажимаю "Удалить выделенные файлы"
Выбираю ячейку с папкой "C:\Море 2024\Оригиналы" + нажимаю "Удалить выделенные файлы"
Получаю:

Привожу пример защиты от ошибочного удаления: если я выделю зеленую ячейку "Море.jpg" и нажму "Удалить выделенные файлы", программа не даст мне этого сделать, т.к. удалится уникальный файл. Аналогично программа не даёт удалить файлы, когда мы выделяем каталог и удаляем из него.

В результате, на данный момент мы оставили файлы "Море + Заказ + Город" только в каталоге "E:\Обои на рабочий стол", а в двух других каталогах мы дубли удалили.

Нажимаем "Заполнить дерево", дерево обновилось, пересечений дублей по 3-м "морским" файлам не осталось:

Примечание: когда флаг физического удаления снят, появляется такой вопрос:

А когда флаг физического удаления установлен, то выделяется жирным, для привлечения внимания:

Важная особенность удаления со сменных носителей USB - удаляемые файлы нельзя поместить в корзину, они удаляются сразу. Тут уже вопрос задаёт сам Windows. Для пример, я выделю каталог "D:\Флешка Гриб и лес для Пети" и нажму "Удалить выделенные файлы":

Выбираю "да", затем обновляю дерево "Заполнить дерево", остаётся пересечение по одному файлу "лес", выбираю зеленый файл, удаляю:
Обратите внимание, если каталоги были в "желтом" столбце "Каталог2" на предыдущем фото, то после обновления они сопоставились между собой:

Обновляю дерево, пересечений нет:

В регистре сведений "Найденный файлы" при удалении файлов - удаляются соответствующие записи, в итоге у нас осталось 5 записей в регистре:

Привожу пример второго сценария, когда один из желтых - это правильный каталог.

Я считаю, что нельзя программе полностью доверять автоматическое удаление файлов, т.к. часто бывает, что дубли нужно оставлять: например, когда мы долго выбираем лучшие фото в отдельную папку, обидно будет их потерять при автоматическом удалении.

Поэтому я оставил для пользователя выбор, из какой папки нужно удалять дубли, и нужно ли вообще их удалять. Исходное дерево:

Пусть верным каталогом "морских" фото будет "C:\Море 2024\Оригиналы"
Выбираю ячейку с папкой "C:\Море 2024" + нажимаю "Удалить выделенные файлы".
Получаю:

Выбираю ячейку с папкой "E:\Обои на рабочий стол" + нажимаю "Удалить выделенные файлы".
В итоге 3 фото удаляются из папки "E:\Обои на рабочий стол", а в дереве очищаются файлы сразу в 6-ти ячейках, обратите внимание

Обновляю дерево, нажимаю кнопку "Заполнить дерево", получаю оставшиеся дубли, дубли "морских" фото исправлены, их не выводит:

В регистре сведений "Найденные файлы" осталось 3 уникальных "морских" фото:

 Пожалуй, это всё.

Буду рад обратной связи.

Запускайте проверку в толстом клиенте - так быстрей. Файлы картинок на моём винчестере 1,5 тб отбираются около 1 часа, правда и фоток у меня много.

При помощи обработки, на данный момент я освободил 150 Гб, в основном это видео.

Код открытый.

Маски файлов прописываются прямо в коде, их можно дополнять в конфигураторе, либо в режиме предприятия - у формы стоит сохранение настроек.

 

Всем летнего настроения !

Ссылка для скачивания конфигурации "Поиск и удаление дублей"

Конкурс, среди скачавших на инфостарте:
Первому, кто отгадает в комментариях на инфостарте все 3 места на фото ниже (Краснодарский край) - тому я добавлю вознаграждение 5 SM в ответе.

Фотки в студию !!!