VRus Feb 16 2010 at 22:13

Аспекты структурирования 2

4 min

606

У читателей Аспектов структурирования 1 сложилось непонимание, к чему это было написано. Подозреваю, что с второй серией выйдет аналогичное. Поэтому поясню, что в процессе написания связного текста, объясняющего некий предположительный стартап, отдельные вещи пришлось расписать относительно подробно, так что они занимают страницы вместо абзаца-другого. Но коль скоро инет-читатели вообще и Хабра в частности не любят длинных текстов, с этим тоже нужно считаться. В итоге выбрал из двух зол и оформил разросшиеся места двумя отдельными заметками, в которых суммированы мои попытки собрать, осмыслить и местами прокомментировать или дополнить существующее относительно тематики структурирования.

Что касается структурирования знаний, восходящий к Аристотелю подход с иерархическими классификациями, таксономиями является почти единственным. Во всяком случае безраздельно доминирующим. Так например организованы папки в Windows. Это удобно, особенно вкупе с визуализацией иерархии. Минус в том, что иерархия может строиться лишь по какому-либо одному критерию или признаку, тогда как её элементы обычно обладают рядом признаков, по которым их можно выстраивать в разные иерархии или объединять в разные множества. Например, одни и те же музыкальные файлы можно систематизировать по жанрам, исполнителям, периоду создания и прочее. Но если вы захотите иметь иерархии по всем этим критериям, придется тупо копировать файлы, занимая место в памяти.

Об альтернативном методе – фасетной классификации, вероятно, не все слышали. Не говоря уж о том, что он далеко не так же интуитивно понятен, как иерархические классификации. Однако большой плюс этого метода несомненен, т.к. решается отмеченная выше проблема – одни и те же объекты могут принадлежать одновременно разным иерархиям или множествам.

Судя по статье в Википедии, на этом список концептуальных подходов полностью исчерпывается. Казалось бы, эти вещи должны относиться к гносеологии/эпистемологии (науке о знании) или когнитологии, но это не прописано четко. Во всяком случае мне не удалось навскидку найти (под)раздел знаний, посвященный в общем виде проблемам классификаций и структурирования знаний. Насколько я понимаю, эпистемология акцентируется на несколько иных вещах, а когнитология не акцентируется на проблемах структурирования в аспекте применимости сугубо для людей, человеческого восприятия. Люди изучаются в плане построения моделей памяти и мышления, но не с целью выведения общих принципов структурирования, на основе которых люди могли бы наиболее адекватно и легко воспринимать знания или оперировать ими, а с целью использования этих моделей в искусственном интеллекте. Кроме того, вопрос можно ставить не только о легкости восприятия. Например, упомянутая выше возможность альтернатив без дублирования контента может быть важна не только с точки зрения экономии памяти, но и с точки зрения социальных взаимодействий в общем вики-пространстве. Отсутствие специализированного раздела, посвященного структурированию, довольно странно, учитывая его всеобщую роль в социуме (как я об том писал в первой статье), а также практическую ценность подобного знания для интернет-сервисов.

Вот на стыке человеческого и машинного, в упомянутой области искусственного интеллекта имеется довольно развитый раздел представления знаний (см. также инженерия знаний), во многом относящийся к проблематике структурирования. Например, в его рамках существует понятие семантических сетей. Последние, как и классификационные иерархии, представимы в виде ориентированного графа. Т.е. эти вещи могли бы изучаться на общей основе, снова-таки, если б этот предмет был сформулирован как самостоятельный раздел знаний.

Отдельно от всего этого в интернете получил широкое распространение такой метод структурирования информации, как снабжение контент-объектов метками-тегами. Объект при этом фактически принадлежит одновременно стольким множествам, сколько разных меток ему присвоено. Хороший способ, пока структурируемое пространство не слишком велико и/или не слишком разнородно. Например, трудно представить себе разумное облако тегов для Википедии. Впрочем, по этому поводу даже пишутся книги — Tagging: Peaple Powered Metadata for the Social Web (которую я не читал. Смотрите также ссылку фолксономия). Судя по названию, под метаданными автор понимает теги.

Последнее слегка расходится с тем, что чаще всего называют метаданными, например, в концепции Semantic Web. Там это данные о данных, краткие стандартизированные описания веб-ресурсов, причем стандартизированные для удобства оперирования машинами, не людьми. Хотя в тему обобщенного понимания метаданных отмечается, что если отойти от жесткой стандартизации, быть ближе к человеческому восприятию, то разница между данными и метаданными станет условной и относительной — один и тот же контент в зависимости от контекста может служить и данными, и метаданными. Не отмечается то, что роль метаданных могут нести связи между объектами. Например, в иерархических (древовидных) структурах связи между объектами по умолчанию идут от общего к частному (или наоборот, это не важно). Важно, что такая связь содержит определенную информацию о связываемых объектах. Если брать семантические структуры, то общая совокупность различных связей-отношений для данного объекта может довольно исчерпывающе его описывать. Это одна из основных идей того стартапа, о котором я планирую написать.

Tags:

Hubs:

Lumber room