Как стать автором
Обновить

Оценка интересов пользователей

Время на прочтение3 мин
Количество просмотров969
На данный момент, для более-менее крупных проектов стаёт довольно актуальный вопрос об оценке интересов аудитории. То есть это не необходимость, без этого можно обойтись, но с другой стороны это может существенно улучшить предоставляемые сервисы и увеличть доход с проекта.
В интернете не очень много информации по этому поводу, те кто уже сделал данный механизм тихо себе радуються и не особо спешат делиться мыслями. А вопрос достаточно непростой. Я бы хотел поднять тут эту тему и попытаться собрать вместе различные идеи. Да, во многом механизм может зависить от структуры проекта, но все же основные идеи выделить можно.
И так, ниже я изложу свои соображения по этому поводу и буду, рад если вы оставите в комментариях свои дополнения и новые идеи. Если тема будет интересна читателям, то в следующем посте я постараюсь собрать все сказанное в комментариях.



Для начала давайте представим себе сам ресурс, на котором будем оценивать интересы пользователей:
  • На ресурсе присутствует некоторая информация в виде статей или товаров, или услуг;
  • Присутствуют личные страницы пользователей;
  • Есть возможно хранить свои фотографии/виде/аудио;
  • Возможность писать личные сообщения;
  • Возможность ведения блогов;
  • Создание сообществ;
  • Оставлять комментарии к различным типам материалов;
  • Голосования.

Пользователи могут в анкете заполнять свои интересы. Практически ко всем типам материалов можно/нужно оставлять теги.
Оценка интереса пользователя должна реагировать на различные действия пользователя. В простейшем случае будем представлять интересы в качестве слов или фраз — по сути теже теги — и не делить их на группы. То есть для каждого пользователя составляем набор интересов (тегов) и показатель «интересности» соответствующего тега.
Показатель «интересности» может выражаться в виде вероятности или же некоего числа. Предлагаю этот показатель называть «весом» интереса, и хранить в виде числа. При необходимости этот вес можно легко пересчитать в вероятность. Вес интереса все время увеличивается, т.е. при совершении действий пользователем мы добавляем к соответствующему весу интереса какое-то число.
И так, для каждого пользователя мы имеем набор тегов — интересов — каждому из которых соответствует некоторое число — вес.
Теперь нужно выделить действия, при которых будет происходить определение интересов. Для начала:
  1. Данные, заполненые в анкете аккаунта.
  2. Пользователь написал пост в своем блоге. В качестве интересов можно использовать теги оставленные к этому посту, так же можно индексировать сам текст поста, но это сложнее.
  3. Оставил комментарии к посту или материалу. В качестве интересов используем теги поста или материала.
  4. Просматривает материал. В качестве интересов теги материала.
  5. Просмотр фотографий, видео, прослушивание аудио. Теги к материалам. Тут надо быть аккуратнее, если аудио/видео это песня/клип, то не факт что стоит их учитывать в интересах (разве что если нужно определить музыкальные предпочтения), а вот если это какой-то обучающий материал, или реклама то теги к ним вполне сойдут за интересы.
  6. Поиск по сайту. Если на ресурсе присутствует форма поиск, то все, что ищет пользователь вполне сойдет в качестве интереса.
  7. Вступление в сообщества. Используем интересы сообщества (теги).

Это линейные действия, которые может совершать пользователь на сайте. Если тема будет интересна, то в следующих статьях поговорим о более сложных действиях пользователя.
Теперь непосредственно операции с весами интересов. Нельзя каждое действие оценивать одинаково. Что-то более весомое, а что-то менее. По-этому, надо составить перечень всех возможных действий и определить им соответствующие плюсуемые веса.
Тут хотелось бы заметить, что оптимальнее будет не просто задать каждому действию свой плюсуемый вес, а сделать некую зависимость между ними.
Т.е. выбрать одно действие, я назвал его «эквивалентным», а все остальные выразить в соотношении с ним. Например, я предлагаю, в качестве эквивалентного действия, использовать написание поста и учитывать теги к нему. Я обозначил эквивалентное действие EQ. Далее можно предположить, что написание поста эквивалентно 100 комментариям к посту. Обозначив плюсуемый вес при добавлении комментария к посту как CPI (comment post interest), получим, что CPI = EQ / 100. Ну и так далее, в итоге нам останется присвоить определенное число для EQ, а остальные будут расчитываться автоматически. Таким образом можно быстро изменить плюсуемые веса для всех действий, и уточнить только для конкретных.
Думаю для начала достаточно, в следующих постах расскажу про более сложные зависимости учета интересов. В комментариях хотелось бы увидеть ваши дополнения по поводу действий совершаемых пользователем и по поводу системы весов.


P.S. Это не вся идея, это только её начало, так, что не надо сразу критиковать за плоскость.
Теги:
Хабы:
Всего голосов 2: ↑1 и ↓10
Комментарии0

Публикации