Управление информационными потоками / Comments / Habr

ur001 Mar 18 2010 at 17:58

Можно попробовать пойти другим путём. Сейчас так работает Хабралента. Принцип её действия похож на системы отлова спама, только вместо спам / не спам у постов на Хабре есть голосованиен и добавление в избранное, которое может расцениваться как нравится / не нравится или хочу / не хочу читать подобное.

Сам алгоритм можно строить хоть на нейронных сетях, хоть на более простых и дешёвых штуках типа Байесовской фильтрации или методе Фишера. В этом случае нужно выделить из единицы информационного потока набор свойств (Кто, где, на что ссылка, является ли автор другом твоего друга, есть ли комменты от друзей, сколько лайков и т.д.: число признаков ограничивается только фантазией) и обучить на like / hide.

Минусув такого подхода 2 (это как я вижу):
Первый: может работать только после сбора достаточного объёма данных.
Второй: может скрыть то, что на самом деле будет интересно человеку.

Для решения первой проблемы у меня есть такие соображения: если проводить аналогию с хабралентой, сначала можно показывать всю ленту «захабренное», а потом, постепенно начинать фильтровать. Чем больше данных тем жестче фильтрация. В вашем случае, в начале, можно ограничиться тем функционалом который вы описывали, а при накоплении статистики по like / hide включать фильтрацию.

Насчёт второй — не знаю. Но думаю что её решение лежит где-то в области проектирования интерфейсов.

Управление информационными потоками

Comments 1

Articles