Pull to refresh
4
0
Кирилл Дивщепольский @divshch

User

Send message

Контекст, награда, много рук. Многорукие бандиты как метод принятия решений

Level of difficultyMedium
Reading time12 min
Views7K

Всем привет! В предыдущих двух статьях мы подробно рассмотрели технические и методологические аспекты A/B-тестирования в Ozon. А сейчас время перейти к не менее интересным темам. Так как наша команда занимается не только A/B-тестами, но и в целом развитием методов принятия решений с помощью causal inference, стоит уделить внимание многоруким бандитам. 

В этой статье мы рассмотрим методологию и границы применимости классических многоруких и контекстуальных бандитов, а также реализуем контекстного бандита, в основе которого будут сэмплирование Томпсона и нейронная сеть. Ну и, конечно, мы постараемся ответить на главный вопрос: могут ли многорукие бандиты заменить A/B-тесты? 

Читать далее
Total votes 33: ↑33 and ↓0+33
Comments1

Information

Rating
Does not participate
Works in
Registered
Activity

Specialization

Data Analyst, Product Analyst
Middle
Git
SQL
Python
PostgreSQL
ClickHouse
Apache Airflow