Комментарии 2
Было бы немного полезнее такие статьи снабжать практическими примерами, а не просто ссылками на arxiv
+1
Полезный класс статей. А то есть куча статей о том, как работает DQN (например), а закодишь - работает бестолково. И потом брутфорсом выясняется, какие именно нужны размеры слоёв, дропаут и размер буфера. И выясняется, что всё это влияет на результат намного больше, чем то, DQN у нас или Sarsa.
В общем, критически не хватает статей по хорошим практикам, спасибо, что делаете
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Обучение с подкреплением: практические рекомендации по обучению сетей Deep Q