Comments / Profile of vivanov879 / Habr

Машинное обучение

Учим агента играть в Mario Kart с помощью фильтров

vivanov879 Nov 13 2018 at 13:04

Да — действительно — про Марио Карт вышло не до конца. Старался показать в посте, как компьютер видит игру. В Марио Карт про визуализацию, пожалуй, нечего добавить.

Look

Обучение с подкреплением: разбираем на видеоиграх

vivanov879 Nov 2 2018 at 10:21

Спасибо. Если вам интересно, чтобы я подробнее написал про какую-то тему, сообщите, а я в следующей статье ее попробую раскрыть.

Look

Обучение с подкреплением: разбираем на видеоиграх

vivanov879 Nov 2 2018 at 10:20

Методы, описанные выше, работают для «рефлекторных» задач. То есть там, где важно быстро среагировать, особо не планируя.
В случае стратегий хорошо работают методы MCTS. Вообще, сложно отдать все на откуп машинному обучению — очень большое пространство состояний системы. То есть большое количество непохожих друг на друга ситуаций в игре. И успешные боты в стратегии отдают лишь часть на откуп обучению с подкреплением. Например, есть интересный репо github.com/deepmind/pysc2. Там полно мини игр. Таким образом, например, бот может быть запрограммирован делать что-то с точки зрения глобального развития, а какие-то мини-игры можно обучить с помощью обучения с подкреплением.

Look

Обучение с подкреплением: разбираем на видеоиграх

vivanov879 Nov 1 2018 at 06:10

Да — верно. Считаем разрешимой и применяем этот метод. Надеемся, что обучение сойдется.

Look

Обучение с подкреплением: разбираем на видеоиграх

vivanov879 Oct 31 2018 at 12:30

Спасибо за то, что прочитали статью. В ней я затронул основные аспекты обучения с подкреплением. Если у вас возникнут какие-либо вопросы, с удовольствием на них отвечу.

Look