Comments 94
Есть предположение, что маковские теги можно каким-нибудь скриптом считать и вставить куда-нибудь (хоть в имя файла). Но я Applescript знаю слабо. В остальных случаях — зависит от возможностей экспорта из конкретной программы.
Да, в макоси теги хранятся в resource fork. Если файлы пишутся в другой файловой системе, то создаются скрытые файлы ._filename.
К сожалению, все эти теги благополучно пропадают при создании резервной копии на NAS, например. Да и инструменты работы с тэгами внутри самой macOS крайне куцые. Мне в своё время пришлось городить велосипед из bash, applescript и alfred workflow чтобы оно хоть сколько-то удобно работало. В итоге отказалась от этой идее вовсе, ибо без рабочего бэкап плана смысла тратить время и силы на подобную организацию просто нет.
К примеру, в XnViewMP есть иерархия категории (тегов). Категории позволяют категоризировоть одной системой и фото, и видео, и другие файлы не поддерживающие теги (pdf, html), и это же программой предсматривать файлы.
Далее, XnViewMP и ACDSee позволяют экспотировать/импортировать свою свою базу категорий в xml или т.п., что позволяет внести изменения своими простенькими скриптами.
Аккурат два месяца назад заморачивался на эту тему. Спасибо.
Bridge как-то слишком тормозной оказался (и, кстати, он таки полностью бесплатный). Hydrus был бы великолепен, не будь маковская версия настолько глючной (ну и вообще как-то страшновато ему всё скармливать). Надо будет ещё ACDSee пощупать.
… когда для очередного файла находится пяток равно подходящих для него разделов...
Вообще, совершенно непонятно, почему в XXI веке я не могу положить один файл в пять папок (что-то типа hard link, но реально работающий).
Почему нет тегов на уровне файловой системы?
Когда уже появится умный поиск, который после анализа сможет найти нужную фотку по запросу одуванчик (или даже нужную песню по запросу "сначала медляк, а потом дабчик")?
А вот все эти программы — страшные костыли, надеюсь они скоро станут ненужны. Но пока это актуально. Спасибо за обзор, действительно есть такая проблема.
Думал об этом еще лет 10 назад. В проводнике windows все так же тупо с каталогизацией файлов..
Почему нет тегов на уровне файловой системы?Вообще-то есть: едва ли не любая современная файлуха умеет в extended атрибуты, вот буквально копипаста из терминала сейчас (FreeBSD, ZFS):
$ touch foo
$ pxattr -n foo foo
Path: foo
pxattr::get: Attribute not found
$ pxattr -n foo -v bar foo
$ pxattr -n foo foo
Path: foo
foo => bar
Проблема в том, что при копировании обычными средствами атрибуты теряются, за этим надо постоянно следить, ну и пока что очень мало mainstream-программ про них знают и умеют правильно с ними работать, в т.ч. переносить между разными файловыми/операционными системами (например, при копировании с NTFS на фрёвую NFS'ную шару).
Когда уже появится умный поиск, который после анализа сможет найти нужную фотку по запросу одуванчик (или даже нужную песню по запросу «сначала медляк, а потом дабчик»)?Мне казалось, что некоторые индексаторы либо это уже делают, либо их можно этому научить. Одуванчики искать, пожалуй, всё-таки пока сложновато, а вот музычку анализировать можно вполне; скажем, какой-нибудь KDE'шный Baloo/Nepomuk вполне мог бы этим заниматься.
Про ios я знал, а вот про Lightroom — это новость для меня. Спасибо, посмотрю. Lightroom classic?
Все-таки нет такого умного поиска в Lightroom локально, без облака.
У них все очень запутанно. :) То что сейчас называется Lightroom CC — это облачный сервис подобный всем остальным. В нем есть умный поиск. Новость по вашей ссылке рассказывает именно об этом сервисе.
A автономный RAW-конвертер на компе, теперь называется Lightroom Classic CC. Это совершенно другой продукт, ничего общего с первым. Я пошарился у них в справке — нет упоминаний интеллектуального поиска.
Похоже только Apple сейчас предоставляет такую фичу без облаков (ну по крайней мере из крупных компаний).
Хранить надо файлы в облаках
(rustavelli)
Вы же понимаете, что нет никаких облаков, а это просто чужой компьютер?! Избитая фраза, но хорошо выражает мое отношение к облакам, в особенности к гугловским.
Вообще, термин «облако» — для конечного пользователя не несёт полезной информации, и является чисто маркетинговым.
Пользователь в принципе не может отличить, хранятся ли его данные действительно распределённо или на одной-единственной машине. Точка входа всё равно одна (будь то URL вбиваемый в браузер или вшитый в клиент).
Но не в качестве основного — как минимум, всё-таки с удаленным хранилищем работать может быть куда менее удобно — канал накладывает ограничения. Да собственно, само наличие канала с достаточной пропускной характеристикой становится ограничением.
И уж точно не в качестве единственного. (Единственное место хранения для инфы, критичной к утрате — вообще не вариант, безотносительно реализации).
Да и цена удаленного хранения всё-таки выше, и за дополнительный объём приходится платить, и за канал. Хотя домашний комп тоже имеет свою стоимость владения, но она размазывается не только на хранение, но и на другие функции.
Кроме того, мы разве говорим исключительно о домашних компах?
А как быть с какой-нибудь корпоративной сетью, изолированной от интернета — а файлы тегировать таки надо?
Или я вот тексты откладываю с тэгом, допустим, «умные мысли». Как оно определит, какие мысли я посчитал умными?
Я придумал! Нужно просто завести себе секретаря, обычного, из мяса. Столько людей с натуральным интеллектом не задействованы… Даже у самых скромных моделей несравнимо более широкий функционал нежели у программок. :)
если вы что-то тегируете, это учитываетсятак о том и речь, что все равно нужен ручной ввод тэгов, возможности автоматической классификации очень сильно ограничены. Даже если ИИ дорастет до требуемого уровня распознавания — он все равно будет ограничен буквальным содержанием файла (изображения или текста — не суть), и никак не может формировать теги, содержащие субъективное отношение к содержанию. Тут нужен уже следующий уровень ИИ — действительно «личный секретарь», отслеживающий жизнь пользователя.
geektimes.com/post/300489/#comment_10761437
Эмоции, мысли — в общем, субъективное отношение. «Отложить на потом для подробного изучения», «Полезная информация», «при случае показать Васе» и т.п.
Иронично, что в самой винде функционал тегирования файлов есть, но, как обычно, реализован через чье-то анальное отверстие и работает только с парой расширений графических файлов.
А также имела бы автоподстановку при заполнении, массовое присвоение/удаление тегов и сохранение/подгрузку их из свойств файлов, помимо хранения в бд программы.
В результате нашёл Daminion — в комплекте всё названное, и ещё иерархия и алиасы тегов / группировка / поиск дублей / поиск по метаданным, включая автора и рейтинг и много другого полезного и бесполезного.
Смотрел в его сторону, но он же больше нацелен на организации. Там, как я смутно понял, нужно отдельно ставить сервер, который поддерживает бд, и отдельно клиент. Или всё проще?
Для меня наилучшим оказался подход TagSpaces, где теги сохраняются в имени файла в формате filename[tag1 tag2… tagN]. Всё остальное использует свои базы данных или специализированные метаданные, из которых выковырять теги у себя в программе — отдельная сложная задача.
Нет никакой сложности правильно работать с метаданными (в любом виде/формате). Единственное оправдание абьюзить имя файла это то, что можно быть на 99% уверенным, что при любом копировании теги не слетят. Но если вы пишете собственное ПО (как следует из комментария), то вполне могли бы сохранять теги elsewhere (расширенные атрибуты, alternative streams, форки и пр. в зависимости от целевой файловой системы).
Когда вы последний раз искали домашнее фото по имени файла? Обычно открываешь папку или делаешь отбор по дате. При таком сценарии использования хранить теги в именах файлов — не такая плохая идея.
Конкретизирую — я пишу ПО под себя, для работы со своими файлами. Соответственно, мне важно побыстрее и попроще получить результат, а не анализировать, как и где можно сохранить данные, не искать библиотеки под это дело. Любые расширенные атрибуты или стримы — это часов 5-8 для поиска библиотек и их интеграции, а я кое-где пишу на кроссплатформенных языках, где с такими библиотеками может быть даже и напряг.
Плюс, конечно, возможность поправить в теги прямо из Проводника, или по-быстрому добавить теги с помощью группового переименования, учитывая дату или имя файла.
Не практический интерес у меня возник: а существуют ли готовые иерархии тегов для общего или специального использования?
Что то вроде классификатора/рубрикатора. Растения-(опциональная классификация для биологов)/(простая классификация по форме или цвету по региону) ИТП.
Я понимаю, что это типа "классификатор всего" но было бы круто такой иметь теоретически.
Способ хранения тегов: файловая система
Группировка тегов: есть
Иерархия тегов: есть
Алиасы тегов: отсуствуют
Автоматизация тегов: отсуствует
Логические операции с тегами при поиске: И, ИЛИ
История поиска тегов: нет
Расшаривание тегов по сети: отсутствует
Способ хранения файлов: файловая система
Виртуальные папки: отсутствуют
Динамические папки: отсутствуют
Группировка файлов: отсутствует
Система рейтинга файлов: частично (5 звезд в виде обычных тегов)
Выявление файлов-дубликатов: отсутствует
Встроенный просмотр файлов: частично
Встроенная корзина: отсутствует
Заметки для файлов: частично
Фиксация URL-источников файлов: отсутствует
Потеря метаданных при нештатном перемещении файлов: нет (метаданные хранятся в имени файла / в побочном файле)
Киллер-фичи: Настройка шаблона хранения тегов, дерево тегов хранится в отдельном файле
Ссылка: Phototagger
Костыль, но давно есть такая штука, как файлы описаний (descript.ion, files.bbs) — вполне можно храгить там теги, но работает для фанатов "ортодоксальных" файл-менеджеров (Far, Total Commander).
Да, продукт полностью коммерческий.
Тэги (keywords в терминах программы) прописывает непосредственно в файл, в соответствии со спецификацией IPTC/NAA, попутно сохряняя в собственном кеше. Групповые шаблоны – чек.
Из «киллер-фич» – возможность хранить базу превьюшек и тэгов (с поиском по ним) для оффлайн-носителей. То есть помимо общего описания, для снимка будет указано место хранения оригинала («Шкаф #, полка ##, коробка ###, диск ####»).
Есть такое приложение — XnViewMP, от производителя XnView и практически дублирующее его функциональность. Там по факту только интерфейс немного отличается.
Оно есть и под Windows, Linux и Mac;
Для Far (третьего) есть плагин FileTags, обеспечивающий работу с тэгами (пока не пробовал, поскольку не было необходимости в таком инструменте, нашел в Far PlugRing из любопытства).
К идеалу приближался WebResearch, самая свежая версия которого вышла в 2013 году. С современными браузерами и сайтами он уже работает откровенно плохо, а вот хорошей смены так и нет.
Из интересного: MyTetra, RightNote, UltraRecall, MyBase, MyInfo, TreeDBNotes, Zotero.
Казалось бы, столько всего пересмотрел, а счастья всё равно нет. Или сохранять не умеет (приходится самому из браузера в MHT экспортировать, а это не всегда удобно), или сохранённые MHT не открывает, или встроенного просмотрщика нет, или просто падает на некоторых файлах… в общем, стараюсь сейчас привыкнуть к TagSpaces, но и у этой программы не всё гладко. Автор обещает обновление в мае, будем ждать.
Такое впечатление, что мало кому эта задача актуальна. Странно. Половина проектов заброшены или условно заброшены. А я почти что в ежедневном режиме пользуюсь, вот ведь у всех свои надобности…
Честно говоря, как-то душа у меня не лежит к модели подписки, когда речь идёт о банальном хранении моих подшивок, которые прекрасно себя чувствуют на винчестере.
Zotero — это более широкого назначения инструмент. Там можно не только с веб страничками работать, но и с научными статьями (в PDF). Раньше с ним пару лет работал, в целом очень достойный проект.
… ишь ты, даже обновляется, совсем свежие версии есть. Бывший родной сайт wizetech сдох, конечно. Я так понял, теперь это Likasoft.
Интересно, она научилась индексировать «на лету» при добавлении файлов в папку, а не регулярным запуском «паука»-индексатора? Надо бы проверить.
В свое время я и бросил ее из-за долгого переиндексирования.
Но это именно поиск по ключевым словам в текстах. Тут же обсуждается более общая задача категоризации — в том числе и бинарных файлов (изображений, программ). Да и исходные коды хоть и текст, но искать в них «по ключевым» — довольно специфическая штука.
У меня архив векторных файлов, есть превью ко всем (в любом графческом формате можно сделать). Хотелось бы к каждому файлу добавить теги и превью.
2) Трудно поспорить.
3) Вы можете создать ярлык с атрибутом и потом тегировать его. Все программы из первой категории смогут работать с ним как с самостоятельным объектом. Разумеется, все недостатки ярлыка никуда не денутся.
4) Могу достоверно сказать, что FenrirFS, Tabbles, Lightroom и Hydrus прекрасно работают с тысячами файлов.
5) Лучшую реализацию такой группировки видел в Bridge. Но в группе нужен будет хотя бы один медиа-файл с поддержкой xmp-тегов.
Вот у меня есть тысячи видеороликов, скачанных с ютуба. На диске они помещены в папки и подпапки по темам и авторам каналов.
Поиск каталогизатора для видеороликов (с тегами, описанием/комментариями, сохранением урла-источника путем поиска ролика на ютубе по его имени) не увенчался успехом. Похоже, мало гиков, кто желал бы организовать свои запасы.
Программы-каталогизаторы типа олмаймуви заточены под фильмы, и под ролики не подходят совершенно.
Попытался заказать разработку программы на фрилансе, к сожалению, попался неуч, который так и не смог ничего сделать (больше внешним видом был увлечен, чем функционалом), хотя ТЗ было подробным и четким. Пришлось отказаться от его услуг.
Так сейчас и сижу на своем добре не организованном.
Попытаю счастья с таблесом, хотя лишние навороты и не нужны.
К сожалению, оставаться в России не вижу смысла, а найти профессора, заинтересованного в чужой теме даже на собственные средства, пока что не очень получается.
К сожалению, общее развитие идет в направлении хранения, управления и структуризации личных данных в корпоративных облаках, а не на устройствах пользователей.
(Например, напомню, что проект Google Desktop был закрыт в 2011 г.)
Содержание статьи неплохо бы перенести в википедию.
Там как раз есть класс статей со сравнительными таблицами по разным видам программ и сервисов.
Заодно в википедии эта информация будет обновляться и уточняться пользователями.
— The tag separators tilde, comma, minus and other symbols are allowed in the filename. However, if they are used in a tag, it will not be recognized as a tag.
— The feedback regarding the confirmation dialog box after every rename is noted. It will be changed in the next release.
Thank you for the review. Let me know if you have any questions.
— In this case I have to remember all the separator characters to avoid them. Wouldn't it be easier if all separator characters are just ignored except the active one?
— Yes, the «do not show again» check box would be a huge relief.
As for the other points:
— For some reasons the search ignores tags even when «tags» box is ticked (v. 1.4.0)
— The app completely ignores tags when there are several delimiter groups in filename. I would suggest to parse at least the first group and ignore the others (or attempt to parse all of them like in TagSpaces, why not?) However it allows adding new tags and puts them at the end of filename.
— Keeping last opened list / files / folder after restart would greatly improve usability.
I'm planning to expand, update and translate this article at some point in future, and I'd be glad to point out the new improvements you've made. Thank you for your reply.
XnView же вроде как и под Linux есть всю жизнь?..
Буду рад ошибиться, но бесплатная, требующая регистрации и не оперсорс программа — это очень рискованная штука для вложения своего времени :(
Слишком много шансов, что ее забросят.
есть вопросы по существу приложения?)
Судя по видео, часть идей очень похожи на Zotero, но заточены на закладки и локальные файлы.
В целом, меня идея заинтересовала, постараюсь попробовать в работе.
Где брать расширение для браузера? И можно ли синхонизировать разные компьютеры?
синхронизация между машинами будет в версии которую пишу. программа будет жить в папке любого облачного сервиса (дропбокс итд) и автоматически синхронизироваться с другими машинами при желании.
также будет добавлена возможность не перемещать файлы во внутреннее хранилище программы. а сохранять ссылки на них.
Zotero не смотрел( посмотрю. у них есть иерархические теги?
у меня основная идея что иерархические теги это как папки только мощнее. поэтому папок нет. а есть облако иерархических тегов. мне не известны программы у которых это есть.
Теговые файловые менеджеры. Сравнительный обзор