Pull to refresh
1
0
Send message
  • При обучении использовался триплет-лосс

  • Негативы генерируются случайным образом при обучении

1) успехом считается попадание предложенных кандидатов в ту же группу или подгруппу что и пост, по которому мы ищем. Т.е. мы отдельно считаем map для групп и для подгрупп.

2)

2.1 получение эмбеддингов происходит в онлайне (см картинку Загрузка эмбеддингов в Vector Index)

2.2 да, плюс-минус верно, краткосрочные и долгосрочные вкусы пользователя это векторы постов. Краткосрочные вкусы это вектора постов, с которыми пользователь взаимодействовал недавно. Долгосрочные - медоиды кластеров из векторов постов, с которыми пользователь успешно провзаимодействовал за 6 месяцев.

2.3 на выходе для каждого долгосрочного и краткосрочного вкуса мы получаем по N наиболее похожи постов из Vector Index. Это происходит в онлайне.

2.4 Ранжирование происходит путем сбора набора фичей, который выходит за рамки данной статьи, вектора постов как фичи в ранкер не передаются.

3) Наш vector index позволяет искать похожие посты по id поста и по вектору поста. Для краткосрочных и долгосрочных вкусов хранимые данные в feature store отличаются:

  • для краткосрочных мы храним только ID поста,

  • для долгосрочных мы храним вектора постов-медоидов

Information

Rating
Does not participate
Location
Саратовская обл., Россия
Date of birth
Registered
Activity