Машинное обучение с подкреплением через соревновательные нейронные сети / Комментарии / Хабр

K1804 6 июн 2020 в 04:39

Спасибо за статью. Что там насчёт гомоку?

Ekzarx 9 июн 2020 в 13:16

Тоже недавно обучал нейронные сети игре в крестики-нолики.
Но у меня сеть оценивала вероятный счёт по итогу игры в случае каждого из вариантов хода и выбирала ход с максимальной оценкой. Вознаграждались все ходы победной или ничейной партии (1 за победу, 0.5 за ничью).
Ходы в занятые клетки просто не рассматривались.
Сеть изначально играла сама с собой.
Архитектура с четырьмя скрытыми слоями: 400, 200, 40, 20 нейронов.
Сеть научилась идеально играть: не проигрывает, а при ошибках соперника выигрывает.

rsashka 8 окт 2021 в 17:12

При такой архитектуре (4 слоя по 400*200*40*20 нейронов), количество связей между нейронами наверно уже превышает возможные варианты ходов, что позволяет нейросети просто запомнить все возможные комбинации.

Машинное обучение с подкреплением через соревновательные нейронные сети

Комментарии 3

Публикации