razrab_from_Mars30 апр 2020 в 14:00

Баланс в принятии решений. Развилка «рандом-опыт»

7 мин

Искусственный интеллектНенормальное программирование *

Комментарии 2

diov 30 апр 2020 в 21:51

Поздравляю! Вы только что описали идею Reinforcement Learning.
А если быть точнее — его подраздел, который описывает планирование (Planning), баланс между изучением (exploration) и достижением результата (exploitation).
Например: алгоритм планирования Monte-Carlo Tree Search был использован при обучении модели AlphaGo, которая сумела обыграть человека в игре Го.

Baigildin 1 мая 2020 в 07:39

Эмм, по-моему вы только что придумали игру
Джона Конвеея под названием "Жизнь".

Зарегистрируйтесь на Хабре, чтобы оставить комментарий