slavikse 5 июн 2020 в 23:25

Машинное обучение с подкреплением через соревновательные нейронные сети

3 мин

JavaScript*Машинное обучение*

Туториал

Технотекст 2020

Комментарии 3

K1804 6 июн 2020 в 01:39

Спасибо за статью. Что там насчёт гомоку?

Ekzarx 9 июн 2020 в 10:16

Тоже недавно обучал нейронные сети игре в крестики-нолики.
Но у меня сеть оценивала вероятный счёт по итогу игры в случае каждого из вариантов хода и выбирала ход с максимальной оценкой. Вознаграждались все ходы победной или ничейной партии (1 за победу, 0.5 за ничью).
Ходы в занятые клетки просто не рассматривались.
Сеть изначально играла сама с собой.
Архитектура с четырьмя скрытыми слоями: 400, 200, 40, 20 нейронов.
Сеть научилась идеально играть: не проигрывает, а при ошибках соперника выигрывает.

rsashka 8 окт 2021 в 14:12

При такой архитектуре (4 слоя по 400*200*40*20 нейронов), количество связей между нейронами наверно уже превышает возможные варианты ходов, что позволяет нейросети просто запомнить все возможные комбинации.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Машинное обучение с подкреплением через соревновательные нейронные сети

Комментарии 3

Публикации

Истории