Comments 6
Те ключ к обучению добавить 10% хаоса в четкую структуру алгоритма ;)
Спасибо за интерес к статье, временно рабочий пример предоставить не можем.
почти рабочий пример пакмана можно найти на Scala (нужно будет обновить зависимости примерно вот так:
scalaVersion := "2.12.8"
libraryDependencies ++= Seq(
"org.scala-js" %%% "scalajs-dom" % "1.2.0",
"io.circe" %%% "circe-generic" % "0.14.1",
"io.circe" %%% "circe-parser" % "0.14.1")
в project/plugins.sbt обновить до sbt-scalajs: 1.7.0 и в файле target поправить ссылку на src="target/scala-2.12/reinforcement-learning-in-scala-master-fastopt.js">
Если интересует reinforcement learning, советую послушать лекцию Cris Birchall. Она не особо подробна (всего 40 минут), но для введения в тему очень даже ничего.
В статье много подозрительных мест. Так, написано о свёрточных слоях, а в коде — только Dense
. И функция get_state
выглядит странно: в массив добавляется только информация о координатах объектов, но не об их типе.
PAC-MAN на основе deep Q network МОДЕЛИ