Я думаю все, кто хотя бы чуть-чуть интересуется миром программных технологий в стане open source, слышали про новую ветку KDE, имеющую номер 4. Эта версия KDE принесла с собой множество новинок, про которые на Хабре уже рассказывалось. Это и Solid, и Phonon, и Plasma, и Decibel. А знаете ли вы, что у KDE4 есть и еще одна штуковина, которой не было в предыдущих версиях? Эта штуковина носит название NEPOMUK-KDE.
[ NEPOMUK ]
Честно говоря, для русского уха звучит это слово как-то, ну, совсем непривычно. А ведь это и не слово вовсе, это аббревиатура: Network Environment for Personalized, Ontology-based Management of Unified Knowledge.
Основная идея NEPOMUK — это метаданные.
[ метаданные ]
Что же такое метаданные?
Мета — метка. Получается, что метаданные — это метка к данным?
На самом деле, метаданные — это информация к информации. Например, у меня есть музыкальный файл Within Temptation — Angels.mp3. Если открыть этот файл в каком-нибудь аудиоредкторе или аудиопроигрывателе, мы увидим метаданные файла — информацию об авторе, названии композиции, годе выпуска песни или альбома, жанр и другое.
Метаданные могут содержать практически все, что угодно. Другой вопрос заключается в том, как различить метаданные от данных.
Метаданные — это тоже данные. А это значит, что у метаданных могут быть свои метаданные, а у тех, в свою очередь, свои метаданные.
[ типы метаданных ]
Метаданные бывают трех типов:
У NEPOMUK цель — уметь управлять всеми тремя типами метаданных, перечисленных выше.
[ зачем нужны метаданные если и без них неплохо жилось? ]
А вот смотрите сами. Просто пример на электрокнигах и электрофотографиях.
Лично я имею неплохую коллекцию электрокнижек отсортированных по каталогам. Есть у меня руководство по iptables (пакетный фильтр в Linux). По смыслу это руководство подходит и в категорию OS/Linux, и в категорию IT Security. Куда поместить документ? Где его потом искать?
У меня есть множество фотографий, на которых изображены разные люди и места. Все фотографии имеют название типа такого: 45DE1.jpg
Ко мне приходят друзья и просят показать удивительную природу Сахалина. Э-э-э… как найти нужные мне снимки? Пролистывать всю коллекцию? А если она состоит из тысяч снимков? Сортировать заранее фотографии с природой в отдельный каталог? А если на снимках не только природа, но есть и люди? Как потом искать фотографии с людьми, если они лежат в одной куче с природой?
Вот тут-то нам и помогут метаданные. Одним из частоиспользуемых типов метаданных является теги. Чтобы далеко не ходить, подскажу, что вы и на Хабре можете увидеть теги (они же метки). Очень удобно, не правда ли, кликнуть по тегу Google и получить все топики, связанные с тематикой популярного поисковика.
Кстати, а ведь можно выставлять и рейтинги файлам. Например, аудиофайлам, по принципу нравится / не нравится. Ну или любому другому принципу, выбирайте сами. =)
В случае с книгой, я могу поставить теги linux, it security. В случае с фотографиями, я могу поставить теги Сахалин, Петя, Маша.
Затем мне не придется рыскать по файловой системе, я просто кликну по нужному тегу и получу список файлов.
Отсюда возникает вопрос: зачем теперь нужно сортировать файлы, переименовывать их, если можем понавесить теги и получить нужный файл независимо от его названия и местоположения в файловой системе? Ответа на этот вопрос у меня нет.
[ проблема метаданных и человека ]
К сожалению, человек существо ленивое. Если ему лень дать вменяемое название файлу, то с чего мы взяли, что его не «обломает» выставлять теги к файлам?
Я не знаю ответа и на этот вопрос. Поэтому ждем продвинутой системы автоматической расстановки тегов.
[ в заключении ]
На сегодняшний день NEPOMUK умеет конечно же далеко не все. Но это еще молодой проект, бурное развитие которого еще впереди.
Напоследок пара скриншотиков.
NEPOMUK, интегрированный в файловый менеджер KDE4 Dolphin (обратите внимание на столбик справа):
NEPOMUK & Strigi:
[ NEPOMUK ]
Честно говоря, для русского уха звучит это слово как-то, ну, совсем непривычно. А ведь это и не слово вовсе, это аббревиатура: Network Environment for Personalized, Ontology-based Management of Unified Knowledge.
Основная идея NEPOMUK — это метаданные.
[ метаданные ]
Что же такое метаданные?
Мета — метка. Получается, что метаданные — это метка к данным?
На самом деле, метаданные — это информация к информации. Например, у меня есть музыкальный файл Within Temptation — Angels.mp3. Если открыть этот файл в каком-нибудь аудиоредкторе или аудиопроигрывателе, мы увидим метаданные файла — информацию об авторе, названии композиции, годе выпуска песни или альбома, жанр и другое.
Метаданные могут содержать практически все, что угодно. Другой вопрос заключается в том, как различить метаданные от данных.
Метаданные — это тоже данные. А это значит, что у метаданных могут быть свои метаданные, а у тех, в свою очередь, свои метаданные.
[ типы метаданных ]
Метаданные бывают трех типов:
- Метаданные, которые можно найти в файлах, хранящихся на жестком диске. Это такие данные, как теги в аудиофайлах, время доступа к файлу или просто проиндексированный текст. Это самые простые метаданные, которые можно проиндексировать в любой момент. И именно эти данные являются основной целью таких проектов, как Beagle и Strigi;
- Метаданные, созданные собственноручно пользователем. В самых простых случаях, это может быть комментарий к файлу или объединение нескольких файлов в одну группу (теги);
- И самый интересный и в то же время самый сложный тип метаданных, которых очень непросто собрать, потому что они хранятся недолго, да и создаются не вручную пользователем. Пример таких метаданных — URL откуда был скачан файл из Интернета. После того, как файл скачан, информация об URL полностью потеряна. Или другой пример. Пользователь получил письмо с вложением. Как только пользователь сохранил вложение на жесткий диск, связь вложения с письмом, в котором оно пришло, теряется. Это значит, что мы уже не узнаем, откуда это вложение, с какого письма. Это лишь самые простые примеры.
У NEPOMUK цель — уметь управлять всеми тремя типами метаданных, перечисленных выше.
[ зачем нужны метаданные если и без них неплохо жилось? ]
А вот смотрите сами. Просто пример на электрокнигах и электрофотографиях.
Лично я имею неплохую коллекцию электрокнижек отсортированных по каталогам. Есть у меня руководство по iptables (пакетный фильтр в Linux). По смыслу это руководство подходит и в категорию OS/Linux, и в категорию IT Security. Куда поместить документ? Где его потом искать?
У меня есть множество фотографий, на которых изображены разные люди и места. Все фотографии имеют название типа такого: 45DE1.jpg
Ко мне приходят друзья и просят показать удивительную природу Сахалина. Э-э-э… как найти нужные мне снимки? Пролистывать всю коллекцию? А если она состоит из тысяч снимков? Сортировать заранее фотографии с природой в отдельный каталог? А если на снимках не только природа, но есть и люди? Как потом искать фотографии с людьми, если они лежат в одной куче с природой?
Вот тут-то нам и помогут метаданные. Одним из частоиспользуемых типов метаданных является теги. Чтобы далеко не ходить, подскажу, что вы и на Хабре можете увидеть теги (они же метки). Очень удобно, не правда ли, кликнуть по тегу Google и получить все топики, связанные с тематикой популярного поисковика.
Кстати, а ведь можно выставлять и рейтинги файлам. Например, аудиофайлам, по принципу нравится / не нравится. Ну или любому другому принципу, выбирайте сами. =)
В случае с книгой, я могу поставить теги linux, it security. В случае с фотографиями, я могу поставить теги Сахалин, Петя, Маша.
Затем мне не придется рыскать по файловой системе, я просто кликну по нужному тегу и получу список файлов.
Отсюда возникает вопрос: зачем теперь нужно сортировать файлы, переименовывать их, если можем понавесить теги и получить нужный файл независимо от его названия и местоположения в файловой системе? Ответа на этот вопрос у меня нет.
[ проблема метаданных и человека ]
К сожалению, человек существо ленивое. Если ему лень дать вменяемое название файлу, то с чего мы взяли, что его не «обломает» выставлять теги к файлам?
Я не знаю ответа и на этот вопрос. Поэтому ждем продвинутой системы автоматической расстановки тегов.
[ в заключении ]
На сегодняшний день NEPOMUK умеет конечно же далеко не все. Но это еще молодой проект, бурное развитие которого еще впереди.
Напоследок пара скриншотиков.
NEPOMUK, интегрированный в файловый менеджер KDE4 Dolphin (обратите внимание на столбик справа):
NEPOMUK & Strigi: