1) успехом считается попадание предложенных кандидатов в ту же группу или подгруппу что и пост, по которому мы ищем. Т.е. мы отдельно считаем map для групп и для подгрупп.
2)
2.1 получение эмбеддингов происходит в онлайне (см картинку Загрузка эмбеддингов в Vector Index)
2.2 да, плюс-минус верно, краткосрочные и долгосрочные вкусы пользователя это векторы постов. Краткосрочные вкусы это вектора постов, с которыми пользователь взаимодействовал недавно. Долгосрочные - медоиды кластеров из векторов постов, с которыми пользователь успешно провзаимодействовал за 6 месяцев.
2.3 на выходе для каждого долгосрочного и краткосрочного вкуса мы получаем по N наиболее похожи постов из Vector Index. Это происходит в онлайне.
2.4 Ранжирование происходит путем сбора набора фичей, который выходит за рамки данной статьи, вектора постов как фичи в ранкер не передаются.
3) Наш vector index позволяет искать похожие посты по id поста и по вектору поста. Для краткосрочных и долгосрочных вкусов хранимые данные в feature store отличаются:
для краткосрочных мы храним только ID поста,
для долгосрочных мы храним вектора постов-медоидов
При обучении использовался триплет-лосс
Негативы генерируются случайным образом при обучении
1) успехом считается попадание предложенных кандидатов в ту же группу или подгруппу что и пост, по которому мы ищем. Т.е. мы отдельно считаем map для групп и для подгрупп.
2)
2.1 получение эмбеддингов происходит в онлайне (см картинку Загрузка эмбеддингов в Vector Index)
2.2 да, плюс-минус верно, краткосрочные и долгосрочные вкусы пользователя это векторы постов. Краткосрочные вкусы это вектора постов, с которыми пользователь взаимодействовал недавно. Долгосрочные - медоиды кластеров из векторов постов, с которыми пользователь успешно провзаимодействовал за 6 месяцев.
2.3 на выходе для каждого долгосрочного и краткосрочного вкуса мы получаем по N наиболее похожи постов из Vector Index. Это происходит в онлайне.
2.4 Ранжирование происходит путем сбора набора фичей, который выходит за рамки данной статьи, вектора постов как фичи в ранкер не передаются.
3) Наш vector index позволяет искать похожие посты по id поста и по вектору поста. Для краткосрочных и долгосрочных вкусов хранимые данные в feature store отличаются:
для краткосрочных мы храним только ID поста,
для долгосрочных мы храним вектора постов-медоидов