NewTechAudit Dec 13 2021 at 11:44

PAC-MAN на основе deep Q network МОДЕЛИ

6 min

3.8K

Programming * Python * Machine learning *

-1

Comments 6

Ukaru Dec 13 2021 at 14:36

Те ключ к обучению добавить 10% хаоса в четкую структуру алгоритма ;)

NewTechAudit Dec 14 2021 at 11:42

Приведена основная часть кода

Vest Dec 13 2021 at 17:12

М-м-м, извините, а рабочий пример будет?

NewTechAudit Dec 14 2021 at 11:41

Спасибо за интерес к статье, временно рабочий пример предоставить не можем.

Yerin Dec 15 2021 at 02:52

почти рабочий пример пакмана можно найти на Scala (нужно будет обновить зависимости примерно вот так:

scalaVersion := "2.12.8"

libraryDependencies ++= Seq(

"org.scala-js" %%% "scalajs-dom" % "1.2.0",

"io.circe" %%% "circe-generic" % "0.14.1",

"io.circe" %%% "circe-parser" % "0.14.1")

в project/plugins.sbt обновить до sbt-scalajs: 1.7.0 и в файле target поправить ссылку на src="target/scala-2.12/reinforcement-learning-in-scala-master-fastopt.js">

Если интересует reinforcement learning, советую послушать лекцию Cris Birchall. Она не особо подробна (всего 40 минут), но для введения в тему очень даже ничего.

m03r Dec 21 2021 at 07:06

В статье много подозрительных мест. Так, написано о свёрточных слоях, а в коде — только Dense. И функция get_state выглядит странно: в массив добавляется только информация о координатах объектов, но не об их типе.