Статьи / Профиль blondered / Хабр

@blondered

Пользователь

ПрофильСтатьи3ПостыНовостиКомментарии3

@blondered 25 авг 2023 в 09:47

Дропаем ранжирующие метрики в рекомендательной системе, часть 3: платформа для экспериментов

Средний

11 мин

Блог компании Open Data ScienceМашинное обучение *

Кейс

В прошлых частях статьи я описывала, как мы экспериментировали с рекомендательными моделями на датасете онлайн-кинотеатра Kion. Считали метрики, проводили визуальный анализ, диагностировали popularity bias и другие проблемы алгоритмов, строили двухэтапные модели.

Кроме онлайн приложения мы построили небольшую, но цельную платформу для экспериментов с рекомендательными моделями. Сегодня я подробно на ней остановлюсь:
- Расскажу о workflow экспериментов и пайплайнах обработки данных.
- О том, какие инструменты мы использовали для реализации платформы.
- Нарисую полную инфраструктуру проекта.

А также опишу, как мы построили эксперименты с кросс-валидацией скользящим окном для моделей, которые используют фичи, зависящие от времени. В том числе как мы сделали валидацию для двухэтапной модели с градиентным бустингом.

Будет много MLOps для RecSys.

RecSys dive ->

@blondered 18 авг 2023 в 07:00

Дропаем ранжирующие метрики в рекомендательной системе, часть 2: двухэтапные модели

Средний

9 мин

Блог компании Open Data ScienceМашинное обучение *

Кейс

В первой части статьи я рассказала, как мы с напарником решили выкатить модель из соревнования в онлайн рекомендации, увидели проблему popularity bias, и затем построили новую модель, сбалансированную по метрикам.

В этой части я опишу, как мы улучшали результат выдачи рекомендаций с помощью двухэтапной модели.

RecSys dive ->

@blondered 11 авг 2023 в 09:45

Дропаем ранжирующие метрики в рекомендательной системе, часть 1: визуальный анализ и popularity bias

Средний

12 мин

12K

Блог компании Open Data ScienceМашинное обучение *

Кейс

Привет, Хабр! Поговорим о RecSys?

Что нужно для построения рекомендательной системы, которая будет полезна бизнесу? Топовые метрики, максимум предсказательной силы, machine learning на полную? Проверим. Сегодня покажу:

• Как (и почему) мы дропнули в 3 раза ранжирующие метрики в пет-проекте по рекомендациям фильмов
• Как искали свой идеальный алгоритм
• Как подобрали релевантные рекомендации на самые разные запросы

Будем говорить обо всех аспектах экспериментов в RecSys: метрики, визуальный анализ, workflow. А результат проверим в онлайн-приложении.

RecSys dive ->

+18

Дропаем ранжирующие метрики в рекомендательной системе, часть 3: платформа для экспериментов

Дропаем ранжирующие метрики в рекомендательной системе, часть 2: двухэтапные модели

Дропаем ранжирующие метрики в рекомендательной системе, часть 1: визуальный анализ и popularity bias

Информация

Специализация