Comments / Profile of doctorclo / Habr

User

Profile Publications 1Comments 3Bookmarks 1

doctorclo Jul 31 2019 at 14:07

В этом хвосте, очевидно, нет никакой поведенческой информации, мы совершенно не знаем, в какие документы пользователи переходят по этим запросам.
В таком случае могут помочь умные текстовые факторы, которые позволят не только находить общие слова между запросом и веб-страницей, но и общую семантику. Для этого активно применяются "'эти самые нейронные сети". Об этом скоро будут следующие публикации, ждите :)

Look

Активное обучение ранжированию

doctorclo Jul 31 2019 at 13:53

Да, это проблема персонализации в ранжировании. Она сейчас стоит довольно остро, просто поднимать страницы со словами из поискового запроса все более менее научились, а вот делать ранжирование персональным под человека уже сложнее.

Look

Активное обучение ранжированию

doctorclo Jul 31 2019 at 12:19

Я здесь особой проблемы не вижу, если я правильно понял Ваш вопрос.
Если у Вас есть признак «сильная любовь данного пользователя к боевикам», есть собранный датасет, где люди, у которых есть этот признак, выбирали сеансы с боевиками, то модель легко выучит такое взаимодействие. Тогда новым людям с таким признаком модель будет показывать боевики.
Если же у Вас люди в признаковом пространстве никак не разделяются, и есть только признак «сильная любовь всех пользователей к данному жанру», то тогда будет показываться, что в среднем любят пользователи. В этом случае советские мультфильмы, да.

Look