Pull to refresh
10
0
Send message
В этом хвосте, очевидно, нет никакой поведенческой информации, мы совершенно не знаем, в какие документы пользователи переходят по этим запросам.
В таком случае могут помочь умные текстовые факторы, которые позволят не только находить общие слова между запросом и веб-страницей, но и общую семантику. Для этого активно применяются "'эти самые нейронные сети". Об этом скоро будут следующие публикации, ждите :)
Да, это проблема персонализации в ранжировании. Она сейчас стоит довольно остро, просто поднимать страницы со словами из поискового запроса все более менее научились, а вот делать ранжирование персональным под человека уже сложнее.
Я здесь особой проблемы не вижу, если я правильно понял Ваш вопрос.
Если у Вас есть признак «сильная любовь данного пользователя к боевикам», есть собранный датасет, где люди, у которых есть этот признак, выбирали сеансы с боевиками, то модель легко выучит такое взаимодействие. Тогда новым людям с таким признаком модель будет показывать боевики.
Если же у Вас люди в признаковом пространстве никак не разделяются, и есть только признак «сильная любовь всех пользователей к данному жанру», то тогда будет показываться, что в среднем любят пользователи. В этом случае советские мультфильмы, да.

Information

Rating
Does not participate
Works in
Registered
Activity