DimonSmart8 июл 2011 в 08:26

Проблемы, подстерегающие любого создателя рубрикаторов

4 мин

9.9K

Data Mining *

Из песочницы

+21

Комментарии 18

overbeat 8 июл 2011 в 09:06

Вся трудность в том, что у каждого свое представление о том как должен быть категоризирован ассортимент. Я например схожу тихо с ума, когда приходится с подругой зайти в женский магазин. Там как я понимаю логика «Что к чему идёт», а мужчины привыкли к четким отделам: тут рубашки, тут штаны, тут обувь. Но женщинам понятно, значит все не зря.

Может в качестве эксперимента попробовать сделать каталог исходя не из того, что есть у продавца, а исходя из потребностей потребителя. Не показывать ему всю «простыню» категорий, а дать выбрать ключевые слова, которые у него в голове есть, когда он заходит на сайт (он их держит «перед собой», чтобы найти их в названиях категорий). Так вот, человеку например надо обить изнутри баню, он не знает, какой лучше материал подходит. Он выбирает например «Баня», «Отделка», «Вагонка» и ему выдаются результаты с вагонкой для бани, которая устойчива к влажности (это к примеру, если есть такая).

Другой вариант, где в прямом эфире, через аякс отфильтровываются результаты. Например изначально в магазине 100 000 наименований, после нажатия «Баня» их становится 3000, после «Отделка» — 200, после «Вагонка» — 30, что уже удобоваримо.

Ну и поиск конечно должен быть хороший.

DimonSmart 8 июл 2011 в 09:26

Отличный пример про расперделение в магазине по теме: «что к чему идёт» vs «рубашки, штаны»

noonesshadow 8 июл 2011 в 09:24

Почему объявление должно быть только в одном разделе?

DimonSmart 8 июл 2011 в 09:27

Объявление только в одном разделе — потому, что изначально речь идет о печатных рубрикаторах. Про особенности трансформации печатных рубрикаторов в интернет-рубрикаторы будет следующая статья.

dab512 10 июл 2011 в 04:09

В печатном издании можно точно так же повторять один и тот же товар в разных разделах, если это необходимо. Если конечно не экономить на бумаге и удобстве пользователей.

Litiy 8 июл 2011 в 14:38

Я так и не нашел почему данный топик в блоге Data Mining… нет никакого намека на автоматизированную семантическую систему извлечения знаний/данных из существующей базы.

tkf 8 июл 2011 в 14:51

Одна из проблем тут состоит имхо в том как именно будет просматриваться рубрикатор, если он может быть любым в глубину. Просто если мы ходим по уровню за раз, то нам без разницы что категории второго уровня дублируются, главное что это удобно. А вот если нам где то надо вывести все дерево, то надо будет вычленять основные узлы, и от них плясать.
Рубрикатор описанный в статье это фолксономия. А описанная в комментариях система все большей фильтрации выборки используя теги это ближе к таксономии. Причем походу без какой то иерархии.

На хабре, да и не только на нем уже вроде всплывали обсуждения такого рода. Как обычно чаще всего в комментариях есть много чего интересного. Например тут (статья не на эту тематику но обсуждается как раз как бы это организовать.) Из этого обсуждени получилась Построение иерархических классификаторов на основе тщательно спроектированной системы тегов.

Вот еще парочка статей на тему тегов и категорий.

Тэги 2.0: сontribute or not! · Spectator.ru

Фолксономия и/или таксономия

А вообще можно почитать обсуждения связанные с семантическими файловыми системами. Там регулярно всплывают обсуждения плюсов и минусов различных способов рубрикации и теггирования.
небольшая подборка ссылок тут

bibendi 9 июл 2011 в 13:42

>> Все попытки создать идеальный рубрикатор превращались в нахождение компромисса между сложным и очень сложным рубрикатором.

Согласен. У нас на сайте уже 84000 рубрик с максимальной глубиной 5 уровней =)

radist2s 9 июл 2011 в 17:52

Кстати, как храните дерево в базе? Adjacency List, Nested Sets?

bibendi 10 июл 2011 в 09:42

Nested sets

Andrey_Belov 10 июл 2011 в 15:29

А что за сайт?

bibendi 11 июл 2011 в 03:21

Нуу, ссылка у меня в хабрацентре

Andrey_Belov 11 июл 2011 в 04:01

Честно говоря, не вижу там ссылки.

bibendi 11 июл 2011 в 04:22

странно, а я вижу =)
Сайт: www.pulscen.ru

Andrey_Belov 11 июл 2011 в 07:17

Может быть, дело в настройках приватности? Ладно, не будем больше оффтопить :) За ссылку спасибо.

Vertex 9 июл 2011 в 15:25

Как по мне то лучше всего тегирование, и на базе этих тегов создавать рубрикаторы и каталоги по релевантности.

DimonSmart 12 июл 2011 в 07:26

Полностью согласен. Тэги — это очень удобно в обработке. Единственная проблемма в том, что люди любят древовидные каталоги и рубрикаторы а переход от тэгов к дереву не всегда однозначен.

copylove 12 июл 2011 в 09:00

При построении рубрикаторов очень сильно помогает карточная сортировка () — всегда полезно забраться в головы пользователям и использовать их ожидания для данной задачи. Если категорий слишком много для такого исследования, то весь объем карточек можно разделить на части или же сортировать только категории верхнего уровня.

Исследования можно проводить очно с применением реальных бумажных карточек, так и в онлайне- существует много сервисов вроде (со стороны пользователей интерфейс этого сервиса русифицирован).

Зарегистрируйтесь на Хабре, чтобы оставить комментарий