Комментарии 9
Похоже, что так оно и есть: довольно универсальная полносвязная нейросеть действительно хорошо играет в шахматы после обучения, не требуя никаких дополнительных встроенных эвристик или специализированной архитектуры.
Against Stockfish (a popular chess engine), on its most rudimentary setting (depth=0, skill=0), the model wins about 4.6% of games (and draws 16.1% of games). Yes, it's really quite terrible
Нейросети сами по себе в игры не очень играют, но я не вижу причин, зачем вводить такие странные ограничения.
Вообще, этот пример и AlphaStar (которая так толком и не научилась играть) демонстрируют, что важно дать определение тому, что такое «решение» задачи.
А чем история с AlphaStar закончилась? Я видел, что она рвала всех с win rate > 70% а потом новые видео с играми перестали появляться.
так и знал, что ссылка будет на Алекса. Он вообще ничего не понимает в ИИ, МЛ, РЛ, ДипЛернинг и тп. Я бы не стал на него ссылаться, он не понимает как это все работает и не читает комментарии умных людей под видео.
Сетка не играет по шаблонам.
Сетка не играет по шаблонам.
Он понимает в Старкрафте, что еще надо? «По шаблонам» — это упрощенный способ сказать «сеть обучали на достаточно стандартных партиях и она не смогла достичь достаточного уровня генерализации, в результате чего проигрывает нестандартным стратегиям, что легко увидеть по матчам на видео». Всем вроде очевидно, что вручную «шаблоны» в неё никто не загружал.
Ну и вообще, я же ничего против Альфа Стар не имею. Она была приведена в качестве примера того, что «решение» — это понятие растяжимое.
Ну и вообще, я же ничего против Альфа Стар не имею. Она была приведена в качестве примера того, что «решение» — это понятие растяжимое.
Большую часть времени агенты АльфаСтар играли сами с собой, а не копировали людей. Алекс ничего не понимает в ИИ, а не в СК2.
Большую часть времени агенты АльфаСтар играли сами с собой, а не копировали людей.
Какая разница с кем они играли? Есть объективный факт: АльфаСтар недостаточно генерализована, это хорошо видно на видео. Почему — это уже другой вопрос. Ну и то, что она сама с собой играла не говорит вообще ни о чем. Точнее, говорит об ограниченности РЛ подхода примененного в лоб в такой вариативной игре.
У вас есть проблема и вы решили использовать нейронную сеть для её решения. Теперь у вас две проблемы.
«Вы — британский зоомагазин со специализацией на попугаях. „
спасибо, вспомнил “this parrot is no more».
спасибо, вспомнил “this parrot is no more».
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как понять, что нейросеть решит вашу проблему. Прагматичное руководство