Как стать автором
Обновить

Особенности практического использования различных алгоритмов Многорукого бандита

Время на прочтение7 мин
Количество просмотров5.5K
Всего голосов 48: ↑48 и ↓0+48
Комментарии2

Комментарии 2

Мне казалось, задача многоруких бандитов — это такое «обучение с подкреплением для бедных», а значит, рассматривается на несколько шагов в игре. Но, похоже, перечисленные Вами алгоритмы — это готовые решения задач нахождения той или иной оптимальной политики. А задача — одношаговая: выдать или нет единицу контента. Или я что-то упустил?

Да, всё так. Только скорее не "выдать или нет единицу контента", а "какую единицу контента выдать"

Зарегистрируйтесь на Хабре, чтобы оставить комментарий