Вся трудность в том, что у каждого свое представление о том как должен быть категоризирован ассортимент. Я например схожу тихо с ума, когда приходится с подругой зайти в женский магазин. Там как я понимаю логика «Что к чему идёт», а мужчины привыкли к четким отделам: тут рубашки, тут штаны, тут обувь. Но женщинам понятно, значит все не зря.
Может в качестве эксперимента попробовать сделать каталог исходя не из того, что есть у продавца, а исходя из потребностей потребителя. Не показывать ему всю «простыню» категорий, а дать выбрать ключевые слова, которые у него в голове есть, когда он заходит на сайт (он их держит «перед собой», чтобы найти их в названиях категорий). Так вот, человеку например надо обить изнутри баню, он не знает, какой лучше материал подходит. Он выбирает например «Баня», «Отделка», «Вагонка» и ему выдаются результаты с вагонкой для бани, которая устойчива к влажности (это к примеру, если есть такая).
Другой вариант, где в прямом эфире, через аякс отфильтровываются результаты. Например изначально в магазине 100 000 наименований, после нажатия «Баня» их становится 3000, после «Отделка» — 200, после «Вагонка» — 30, что уже удобоваримо.
Объявление только в одном разделе — потому, что изначально речь идет о печатных рубрикаторах. Про особенности трансформации печатных рубрикаторов в интернет-рубрикаторы будет следующая статья.
В печатном издании можно точно так же повторять один и тот же товар в разных разделах, если это необходимо. Если конечно не экономить на бумаге и удобстве пользователей.
Я так и не нашел почему данный топик в блоге Data Mining… нет никакого намека на автоматизированную семантическую систему извлечения знаний/данных из существующей базы.
Одна из проблем тут состоит имхо в том как именно будет просматриваться рубрикатор, если он может быть любым в глубину. Просто если мы ходим по уровню за раз, то нам без разницы что категории второго уровня дублируются, главное что это удобно. А вот если нам где то надо вывести все дерево, то надо будет вычленять основные узлы, и от них плясать.
Рубрикатор описанный в статье это фолксономия. А описанная в комментариях система все большей фильтрации выборки используя теги это ближе к таксономии. Причем походу без какой то иерархии.
А вообще можно почитать обсуждения связанные с семантическими файловыми системами. Там регулярно всплывают обсуждения плюсов и минусов различных способов рубрикации и теггирования.
небольшая подборка ссылок тут
Полностью согласен. Тэги — это очень удобно в обработке. Единственная проблемма в том, что люди любят древовидные каталоги и рубрикаторы а переход от тэгов к дереву не всегда однозначен.
При построении рубрикаторов очень сильно помогает карточная сортировка () — всегда полезно забраться в головы пользователям и использовать их ожидания для данной задачи. Если категорий слишком много для такого исследования, то весь объем карточек можно разделить на части или же сортировать только категории верхнего уровня.
Исследования можно проводить очно с применением реальных бумажных карточек, так и в онлайне- существует много сервисов вроде (со стороны пользователей интерфейс этого сервиса русифицирован).
Проблемы, подстерегающие любого создателя рубрикаторов