slavikse5 июн 2020 в 23:25

Машинное обучение с подкреплением через соревновательные нейронные сети

3 мин

9.7K

JavaScript * Машинное обучение *

Туториал

Технотекст 2020

Комментарии 3

K1804 6 июн 2020 в 01:39

Спасибо за статью. Что там насчёт гомоку?

Ekzarx 9 июн 2020 в 10:16

Тоже недавно обучал нейронные сети игре в крестики-нолики.
Но у меня сеть оценивала вероятный счёт по итогу игры в случае каждого из вариантов хода и выбирала ход с максимальной оценкой. Вознаграждались все ходы победной или ничейной партии (1 за победу, 0.5 за ничью).
Ходы в занятые клетки просто не рассматривались.
Сеть изначально играла сама с собой.
Архитектура с четырьмя скрытыми слоями: 400, 200, 40, 20 нейронов.
Сеть научилась идеально играть: не проигрывает, а при ошибках соперника выигрывает.

rsashka 8 окт 2021 в 14:12

При такой архитектуре (4 слоя по 400*200*40*20 нейронов), количество связей между нейронами наверно уже превышает возможные варианты ходов, что позволяет нейросети просто запомнить все возможные комбинации.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий