Как стать автором
Обновить

Как понять, что нейросеть решит вашу проблему. Прагматичное руководство

Время на прочтение12 мин
Количество просмотров13K
Всего голосов 45: ↑45 и ↓0+45
Комментарии9

Комментарии 9

Похоже, что так оно и есть: довольно универсальная полносвязная нейросеть действительно хорошо играет в шахматы после обучения, не требуя никаких дополнительных встроенных эвристик или специализированной архитектуры.

Against Stockfish (a popular chess engine), on its most rudimentary setting (depth=0, skill=0), the model wins about 4.6% of games (and draws 16.1% of games). Yes, it's really quite terrible

Нейросети сами по себе в игры не очень играют, но я не вижу причин, зачем вводить такие странные ограничения.

Вообще, этот пример и AlphaStar (которая так толком и не научилась играть) демонстрируют, что важно дать определение тому, что такое «решение» задачи.

А чем история с AlphaStar закончилась? Я видел, что она рвала всех с win rate > 70% а потом новые видео с играми перестали появляться.

Ну уровня AlphaGo или шахматных программ она не достигла, ну и вообще умеет играть только по шаблону видимо. Вот разбор. Если цель была сделать бота, который на высоком уровне играет по стандартным сценариям, ее достигли, если «победить» в старкрафте, то нет.
так и знал, что ссылка будет на Алекса. Он вообще ничего не понимает в ИИ, МЛ, РЛ, ДипЛернинг и тп. Я бы не стал на него ссылаться, он не понимает как это все работает и не читает комментарии умных людей под видео.
Сетка не играет по шаблонам.
Он понимает в Старкрафте, что еще надо? «По шаблонам» — это упрощенный способ сказать «сеть обучали на достаточно стандартных партиях и она не смогла достичь достаточного уровня генерализации, в результате чего проигрывает нестандартным стратегиям, что легко увидеть по матчам на видео». Всем вроде очевидно, что вручную «шаблоны» в неё никто не загружал.

Ну и вообще, я же ничего против Альфа Стар не имею. Она была приведена в качестве примера того, что «решение» — это понятие растяжимое.
Большую часть времени агенты АльфаСтар играли сами с собой, а не копировали людей. Алекс ничего не понимает в ИИ, а не в СК2.
Большую часть времени агенты АльфаСтар играли сами с собой, а не копировали людей.

Какая разница с кем они играли? Есть объективный факт: АльфаСтар недостаточно генерализована, это хорошо видно на видео. Почему — это уже другой вопрос. Ну и то, что она сама с собой играла не говорит вообще ни о чем. Точнее, говорит об ограниченности РЛ подхода примененного в лоб в такой вариативной игре.

У вас есть проблема и вы решили использовать нейронную сеть для её решения. Теперь у вас две проблемы.

«Вы — британский зоомагазин со специализацией на попугаях. „
спасибо, вспомнил “this parrot is no more».
Зарегистрируйтесь на Хабре, чтобы оставить комментарий