Comments / Profile of Parilo / Habr

How to become an author

Печенко Антон @Parilo

Программист

ProfileArticles6PostsNewsComments37

Нейросетка играет в Доту

Parilo Oct 23 2017 at 21:57

Все правильно, только не на все хватает времени в период чемпионата. Так как чтобы увидеть, что какое-то изменение реально работает, бывает, надо потратить несколько дней на обучение

Нейросетка играет в Доту

Parilo Oct 22 2017 at 08:54

Согласен, но при недостатке мощностей сеть лучше учится на более частых наградах, чем на какой-то очень далекой, но самой важной награде

Домашнее задание от МТИ: пишем нейросеть для манёвров в дорожном трафике

Parilo Jan 24 2017 at 09:19

Выложил решение с описанием
текст
видео

Нейросетка играет в Доту

Parilo Jan 17 2017 at 10:30

Далеко не все глубокие нейронные сети рекуррентные, сверточная нейросеть тоже не рекуррентная.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 19:57

А можно поподробнее про подбор архитектуры ИНС для задачи? Посоветуйте где можно почитать/посмотреть про подбор архитектур ИНС? Если не использовать эволюционные алгоритмы.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 18:30

Это другой метод, но это возможно, нужно только взять где-то эти данные

Нейросетка играет в Доту

Parilo Jan 16 2017 at 12:51

Согласен, ввести какие-то разумные ограничения не помешало бы.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 12:43

Соревнование действительно оказалось не очень подходящим для нейросетей, так как ресурсов мало и нельзя использовать готовые библиотеки. Но если есть какие-то заготовки то почему нет? У меня как раз некоторые заготовки были, поэтому я и решился. В прошлом году заготовок не было, поэтому не участвовал.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 12:40

Про генетические алгоритмы есть довольно много инфы. Да, это нейросеть с большим количеством параметров — весов.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 12:35

Протестировать его с тем же seed на тех же партиях. Или на небольшой выборке партий.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 12:33

Спасибо, посмотрю.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 12:32

Я не спец в генетических алгоритмах, но я думаю что можно, только если тупо в лоб, то вероятно это будет долго, с учетом того, что локальный симулятор работает довольно долго. Наверное нужно как-то бить на подзадачи и какой-то свой симулятор писать.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 12:24

Периодически можно было бы устраивать ланы с расписанием, жеребьевкой и прочим. Ну и потом просто посмотреть в код перед определением победителя.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 09:56

Матч не назначается системой, стратегии логинятся и запрашивают матч, дальше система подбирает им соперников, которые есть он-лайн, с учетом рейтинга. С накрутками должен бороться рейтинг. Опять же в Старкрафте 2 нету проблемы частотой матчей. Есть игроки, которые часто играют и все равно находятся снизу в рейтинге и те, кто играет не часто и находится в топе, только за счет скилла.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 09:53

У меня проц i7 6700k
Загрузка GPU сильно зависела от размера состояния, на 394 параметрах была около 20%, на 3144 опускалась ниже 10% вроде бы. И как я понял дело даже не в проце, просто надо реорганизовать обучение. У меня весь опыт по мере поступления складывается в replay buffer и оттуда же я выбираю минибатчи для обучения, затем отправляю их в TensorFlow. На supervised learning задачах, где изначально есть датасет и ты по нему бегаешь загрузка 99% на GPU. Я думаю, надо попробовать сделать как в supervised, то есть иметь отдельно буфер для складывания опыта и второй для обучения и периодически их синхронизировать. И еще лучше попытаться организовать этот буфер прямо в GPU.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 07:49

На досуге можно попробовать. Если займусь, то добавлю в пост еще одно видео.

Нейросетка играет в Доту

Parilo Jan 16 2017 at 07:47

Тут я бы предложил по аналогии со Старкрафтом, стратегия логинится и запрашивает поиск игры, тогда нет необходимости в 24/7

Логика сознания. Часть 7. Самоорганизация пространства контекстов

Parilo Oct 11 2016 at 18:58

Интересная идея, мне кажется, так можно решить проблему с перестановкой колонок. Они автоматически формируются рядом с близкими.

О новых успехах противостояния (СР УВЧ!*)

Parilo Sep 22 2016 at 13:33

Да, это используется очень часто. Это помогает максимально быстро набрать банк наиболее разнообразного опыта для обучения.

О новых успехах противостояния (СР УВЧ!*)

Parilo Sep 22 2016 at 13:10

Смотря как на это посмотреть. Используется обучение с подкреплением, то есть награды и штрафы. Но вот радость и печаль надо сначала каким либо образом определить, но это уже философский вопрос… В любом случае при текущем развитии НС, это как пытаться определить что чувствует нематода или еще какой-либо простой организм.

1