Сверхчеловеческую скорость AlphaStar внедрили как заплатку для ошибки имитационного обучения?

Автор оригинала: Aleksi Pietikäinen
  • Перевод
Вероятно, все уже слышали, что ИИ под названием AlphaStar от компании Google Deepmind размазал профессионалов в стратегии реального времени Starcraft 2. Это беспрецедентный случай в исследованиях Искусственного интеллекта. Но хочу высказать конструктивную критику по поводу этого достижения.

Постараюсь убедительно доказать следующее:

  1. AlphaStar играл со сверхчеловеческой скоростью и точностью.
  2. Deepmind утверждает, что запретила ИИ выполнять действия, которые физически невозможны для человека. Разработчики не преуспели в этом и, вероятно, знают о своём косяке.
  3. Причина, по которой AlphaStar играет на сверхчеловеческих скоростях, скорее всего, связана с его неспособностью избавиться от приобретённого навыка спам-кликов. Подозреваю, что разработчики хотели сделать программу более гуманной, но не смогли. Потребуется время, чтобы подойти к данному тезису. Но это главная причина, почему я написал статью, так что прошу проявить терпение.

Прежде всего хочу уточнить, что я непрофессионал. Я много лет следил за развитием ИИ и сценой Starcraft 2, но не претендую на роль эксперта. Если вы заметите какие-то заблуждения, пожалуйста, укажите на них. Я всего лишь фанат и всё это невероятно увлекательно для меня. В статье много спекуляций, и я признаю, что не могу окончательно доказать основные претензии. Со всеми оговорками, если вы прочитаете статью и не согласитесь со мной, пожалуйста, аргументируйте конструктивно. Очень хочу, чтобы вы меня разубедили.

В конце концов, AlphaStar — удивительное достижение. На мой взгляд, величайшее достижение Deepmind на сегодняшний день, и я с нетерпением жду, как ещё усовершенствуют эту программу. Спасибо за ваше терпение. Итак, поехали.

Сверхчеловеческая скорость AlphaStar


Дэвид Сильвер, соруководитель команды AlphaStar: «AlphaStar не может реагировать быстрее и не может сделать больше кликов, чем живой игрок».


Здесь ведущий проектировщик ИИ делает важное заявление (с 1:39)

В 2018 году на сцене Starcraft 2 доминировал Serral. Он действующий чемпион мира и выиграл семь из девяти крупных турниров, в которых участвовал, что привело к одному их самых мощных примеров доминирования одного игрока в истории Starcraft 2. Парень очень быстрый. Возможно, самый быстрый в мире.

Вид от первого лица (с 13:00):


Взгляните на его APM в левом верхнем углу. Это сокращение для количества действий в минуту. По сути это число отражает, как быстро игрок нажимает на кнопки мыши и клавиатуры. Ни разу Serral не может надолго удержать APM более 500. Есть один всплеск до APM 800, но только на долю секунды и, скорее всего, в результате спам-кликов, о которых я скоро расскажу.

Итак, самый быстрый в мире игрок способен удержать впечатляющий уровень APM 500, но у AlphaStar были всплески до 1500+. Эти нечеловеческие показатели более APM 1000 иногда длились пять секунд и полны осмысленных действий. 1500 действий в минуту — это 25 действий в секунду. Это физически невозможно для человека. Также прошу учесть, что в игре Starcraft пять секунд — большой срок, особенно в самом начале большого сражения. Если сверхчеловеческий показатель в первые пять секунд даёт ИИ преимущество, то он легко выиграет сражение благодаря эффекту снежного кома. Вот завязка битвы AlphaStar в третьей игре против MaNa (с 59:30):


AlphaStar удерживает APM 1000+ в течение пяти секунд. Ещё одна завязка в четвёртой игре с заоблачным APM 1500+ (c 2:11:32):


Один из комментаторов указывает на приемлемый показатель среднего APM. Но совершенно очевидно, что указанные всплески намного выше человеческих способностей.

Спам-клики, APM и хирургическая точность роботов


Большинство игроков проявляет склонность к спам-кликам. Бессмысленные клики, которые ни на что не влияют. Например, человек перемещает армию и зачем-то щёлкает несколько раз в точке назначения. Какой эффект? Никакого. Армия не пойдёт быстрее. Одного клика было достаточно. Тогда зачем он это делает? Есть две причины:

  1. Спам-клик — естественный побочный эффект, когда человек старается кликнуть как можно быстрее.
  2. Помогает разогреть пальцы.

Помните, Serral'а? Его впечатляющая мощь на самом деле не в скорости нажатий, а в точности. У него не только действительно высокий APM, но и потрясающе эффективный (общее количество кликов в минуту, кроме спам-кликов). С этого момента я буду сокращать эффективный APM как EPM. Важно помнить, что EPM учитывает только значимые действия.

Взгляните, как бывший профессионал потерял рассудок в твиттере, узнав EPM Serral'а:


Его EPM 344 — практически нереальный показатель. Он настолько высок, что мне до сих пор трудно поверить, что это правда. Разница между APM и EPM повлияла также на AlphaStar. Если ИИ может играть без спам-кликов, не означает ли это, что его пиковый EPM временами равен пиковому APM? Это делает всплески до 1000+ еще более нечеловеческими. Когда мы принимаем во внимание, что AlphaStar играет с идеальной точностью, то его механические возможности кажутся совершенно абсурдными. Он всегда нажимает именно там, где он хочет нажать. Люди промахиваются, а AlphaStar в нужные моменты начинает работать в четыре раза быстрее, чем самый быстрый игрок в мире — с точностью, о которой человек может только мечтать.

Практически все в сообществе согласны, что AlphaStar выполнял последовательности, которые ни один человек не способен повторить. Он был быстрее и точнее, чем это возможно физически. Самый быстрый в мире профессионал действует в несколько раз медленнее. Точность невозможно даже сравнить.

Утверждение Дэвида Сильвера, что AlphaStar может выполнять только действия, которые способен воспроизвести человек, просто не соответствует действительности.

Делать всё правильно или просто включить скорость?


Ориол Виньялс, ведущий архитектор AlphaStar: «Важно осваивать игры, признанные «фундаментальными проблемами для ИИ». Мы пытаемся создать интеллектуальные системы, которые перенимают наши удивительные возможности, поэтому очень важно, чтобы они обучались максимально „по-человечески”. Как бы круто ни звучало, но достижение максимальных показателей в игре, вроде очень высоких APM, на самом деле не помогает нам измерить возможности и прогресс наших агентов, что делает бенчмарк бесполезным».

Почему Deepmind хочет ограничить агента, чтобы он играл как человек? Почему бы просто не пустить его во все тяжкие без каких-либо ограничений? Причина в том, что в Starcraft 2 механические суперспособности портят геймплей. В этом видео бот несколькими зерглингами атакует группу танков, реализуя идеальную микротактику. Обычно зерглинги почти ничего не могут сделать против танков, но благодаря роботам микротактика становится гораздо более смертоносной: они уничтожают танки с минимальными потерями. С таким хорошим управлением юнитами ИИ не нужно изучать стратегию. Deepmind ведь не заинтересован в создании ИИ, который просто побеждает профессионалов Starcraft, на самом деле они хотят использовать этот проект в качестве ступеньки в продвижении общих исследований ИИ. Очень грустно, что один из руководителей проекта заявляет об ограничениях наравне с человеческими способностями, когда агент явно их нарушает и выигрывает свои игры именно благодаря сверхчеловеческому исполнению.

AlphaStar превосходит людей в управлением юнитами — этот фактор не был принят во внимание, когда разработчики тщательно балансировали игру. Этот нечеловеческий контроль способен испортить любое стратегическое мышление, которое освоил ИИ. Он даже может сделать стратегическое мышление совершенно ненужным. Программа не просто застряла на локальном максимуме. Если игра ведётся с нечеловеческой скоростью и точностью, то злоупотребление идеальным контролем юнитов, скорее всего, будет лучшим, наиболее эффективным и надёжным способом выиграть. Как бы грустно это не звучало.

Вот что сказал о сильных и слабых сторонах AlphaStar один из профессионалов, проиграв ему со счётом 1-5:

MaNa: «Я бы сказал, что его лучшее качество — это управление юнитами. Во всех играх с примерно одинаковым количеством юнитов победил AlphaStar. Худший аспект по итогу небольшого количества игр — упрямый отказ апгрейдиться. Он был настолько убеждён в победе базовыми юнитами, что практически ничего не апгрейдил, за что в итоге поплатился в выставочном матче [последняя игра с MaNa, где ИИ проиграл — прим. пер.]. В принятии решений было не так много решающих моментов, поэтому я бы сказал, что причиной победы стала механика».

Среди поклонников Starcraft почти единодушное мнение, что AlphaStar выиграл почти исключительно из-за своей сверхчеловеческой скорости, времени реакции и точности. Профи, которые играли против него, похоже, согласны с этим. Один из сотрудников Deepmind играл против AlphaStar, прежде чем программу поставили против профессионалов. Скорее всего, он тоже согласится с такой оценкой. Дэвид Сильвер и Ориол Виньялс повторяют мантру, что AlphaStar способен делать только то, что и человек, но мы уже видели, что это просто не так.

Непохоже, что AlphaStar «делает всё правильно», как говорит Дэвид (с 1:38):


Что-то здесь явно не так.

Почему Deepmind допустила сверхчеловеческую скорость AlphaStar?


Наконец, перейдём к главному. Спасибо, что дочитали до этого места. Но сначала подведём итоги.

  • Мы знаем, что такое APM, EPM и спам-клики.
  • У нас есть некоторое понимание максимальных возможностей человека.
  • Игра AlphaStar прямо противоречит утверждениям разработчиков о его ограничениях.
  • Сообщество Starcraft 2 сошлось во мнении, что AlphaStar выиграл благодаря нечеловеческому контролю юнитов и даже не нуждался в превосходном стратегическом мышлении.
  • Deepmind не ставит задачу создать быстрого бота, поэтому он не должен был так играть.
  • Очень маловероятно, что никто из команды Starcraft AI не подумал, что человек не способен повторить всплески APM 1500+. Их спец по Starcraft должен знать о Starcraft побольше моего. Они тесно сотрудничают с Blizzard, которая владеет интеллектуальной собственностью на StarCraft. В их интересах (см. предыдущий пункт, а также заявления Сильвера и Виньялса) заставить бота действовать как можно ближе к человеку.

Принимая во внимание все эти моменты, почему Deepmind вообще позволил ИИ явно обойти ограничения человеческого тела?

Это чистая спекуляция с моей стороны и я не утверждаю, что знаю точно историю. Но подозреваю, что произошло следующее:

В самом начале проекта Deepmind согласовала жёсткие лимиты. В этот момент AlphaStar запретили сверхчеловеческие всплески APM, которые мы видели в демонстрации. Если бы я проектировал систему, то установил бы такие ограничения:

  • Максимальный средний APM на протяжении всей игры.
  • Максимальный кратковременный всплеск APM. Думаю, что разумно установить его на уровне 4-6 кликов в секунду. Помните Serral'а и его EPM 344, что на голову выше конкурентов? Это меньше шести кликов в секунду. Против MaNa программа выдавала 25 кликов в секунду в течение длительных периодов времени. Это намного быстрее, чем даже самые быстрые спам-клики человека, так что вряд ли исходные ограничения разрешали такое.
  • Минимальное время между кликами. Даже если ограничить максимальную скорость во время всплесков, бот может очень быстро кликать в краткий момент во время разрешённого интервала, на что не способен человек.

Некоторые предлагают добавить элемент случайности в точность кликов, но я подозреваю, что это слишком снизит скорость обучения.

Итак, установили лимиты. Что дальше? Затем Deepmind запустил имитационное обучение на тысячах видеозаписей любительских игр высокого класса. На данном этапе агент просто пытается имитировать то, что делают люди — и он осваивает спам-клики. Это весьма вероятно, потому что люди очень часто их делают. Это почти самая повторяющаяся модель поведения у людей, поэтому она должна очень глубоко укорениться в поведении агента.

Максимальные всплески APM у AlphaStar изначально близки к установленным лимитам. Но большинство кликов AlphaStar оказались спам-кликами, так что его APM оказался недостаточным для нормального боя. Но без экспериментов нет обучения. Вот что сказал один из разработчиков во вчерашнем AMA: думаю, он немного замазан в этой афере:

Ориол Виньялс, ведущий архитектор AlphaStar: «Обучать ИИ играть с низким APM довольно интересно. В первые дни наши агенты обучались с очень низкими APM и оказались вообще не способны к микроменеджменту».

Чтобы ускорить обучение, разработчики повышают лимиты APM, разрешив кратковременные всплески. Вот ограничения APM, которые действовали для AlphaStar в демонстрационном матче:

Ориол Виньялс: «В частности, мы установили лимит 600 APM в интервалах 5 секунд, 400 APM в интервалах 15 секунд, 320 на 30 секунд и 300 на 60 секунд. Если агент выдаёт больше действий в эти интервалы, мы их отбрасываем/игнорируем. Эти значения взяты из человеческой статистики».

Если вы не очень хорошо знакомы со Starcraft, то такие лимиты выглядят разумными, однако они допускают сверхчеловеческие всплески APM, о которых мы говорили ранее, а также сверхчеловеческую точность.

Существует ограничение на максимальное количество спам-кликов. Обычно это команды перемещения или атаки, когда совершается щелчок по карте. Попробуйте, насколько быстро вы сможете нажимать кнопку мыши. Агент обучился спам-кликам у игроков и не будет щёлкать быстрее человека. То есть дополнительные клики APM на сверхчеловеческой скорости являются «произвольными» для экспериментов.

Произвольный APM используется для экспериментов в битвах. Такое взаимодействие часто происходит во время тренировки. AlphaStar начинает изучать новый тип поведения, который приводит к лучшим результатам, и доля спама в кликах снижается.

Если агент усвоил полезные действия, почему Deepmind не вернулся к первоначальным более жёстким, более гуманным ограничениям на APM? Наверняка они поняли, что ИИ демонстрирует сверхчеловеческие способности. Сообщество Starcraft почти единодушно признало нечеловеческий микроменеджмент AlphaStar. Профи сказали в AMA, что главная сила AlphaStar — контроль над юнитамии, а основная слабость — стратегическое мышление. Должно быть, разработчики Deepmind пришли к тому же выводу. Вероятно, причина в том, что агент не смог избавиться от спам-кликов. Хотя большую часть времени он действует чётко, но всё равно регулярно сваливается в спам-клики. Это очевидно в первой игре против MaNa, когда Alphastar поднимается вверх по рампе (с 39:30):


Внимательно смотрите на синие кружки с выделением юнитов

Агент спам-кликал команды на перемещение юнитов со скоростью 800 APM. Он так и не отучился полностью от человеческих глупостей, хотя эти действия совершенно бесполезны и съедают его лимит APM. Баг особенно опасен во время больших сражений. Вероятно, лимит APM подняли, чтобы исправить косяк и позволить агенту нормально работать в такие моменты.

Что в этом такого важного?


Подозреваю, что агент не смог избавиться от спам-кликов, которые усвоил во время имитационного обучения на людях. Deepmind пришлось повозиться с лимитом APM, чтобы стали возможными эксперименты и дальнейший прогресс. Однако проявился неприятный побочный эффект сверхчеловеческой игры, из-за которой по сути агент нарушает правила, будучи в состоянии реализовать стратегии, которые ему изначально запретили.

Это важная вещь, потому что подобное избиение профессионалов прямо противоречит миссии, которую неоднократно заявляла Deepmind. Из-за чего этот график оставляет во рту кислый привкус лицемерия:



Это изображение Deepmind опубликовала в своём блоге

Похоже, график рассчитан на то, чтобы ввести в заблуждение людей, незнакомых со Starcraft 2. Он изображает якобы приемлемый APM у AlphaStar. Посмотрите на APM MaNa и сравните его с AlphaStar. Хотя среднее значение выше у MaNa, хвост AlphaStar выходит далеко за пределы человеческих возможностей. Обратите внимание, что пиковый APM у MaNa составляет около 750, в то время как у AlphaStar выше 1500. Теперь учтите, что у человека APM более чем наполовину состоит из спам-кликов, а EPM AlphaStar — это идеально точные нажатия.

Теперь взгляните на APM у TLO. Хвост уходит на 2000. Подумайте об этом на секунду. Как такое возможно? Это стало возможным благодаря трюку под названием «быстрый огонь». TLO не щёлкает супербыстро. Он просто держит кнопку — и игра регистрирует это как 2000 APM. Единственное, что вы можете сделать с быстрым огнём — это спамить с сумасшедшей скоростью. Вот и всё. TLO просто использует это по какой-то причине. Но при этом маскируются сверхчеловеческие всплески APM у AlphaStar — и цифры выглядят реалистично для людей, которые не знакомы со Starcraft.

Сообщение в блоге Deepmind не пытается объяснить абсурдные цифры TLO. Если они не объясняют дутые показатели TLO, то не должны включать их в график. Точка.

Такая статистика опасно приближается к вранью. Deepmind следовало бы придерживаться более высоких стандартов.
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее
Реклама

Комментарии 322

    +8
    AlphaStar побеждал вовсе не из-за сверхчеловеческой скорости и точности кликов, все намного проще — он видел сразу все поле боя, что позволяло полноценно контролить несколько групп юнитов одновременно. Это же и служило одной из причин высокого APM: когда игрок контролит 1 отряд, бот справляется с тремя и больше. Как только боту ограничили зону видимости он сразу превратился в куклу для битья для Маны.
    Вообще стоит посмотреть на игры других ботов, там APM бывает и по 20к, но это слабо помогает в играх против людей.
    Ну и несколько мыслей вслух:
    eAPM корректнее чем EPM;
    Serral не самый «ярый кликер»;
    AlphaStar это не один бот, а набор агентов с разными стратегиями, в этих шоуматчах использовались разные агенты в каждой игре.
      0

      Авторы утверждают, что агент с меньшей зоной видимости недоучился — учился 7 дней против 14 у других.

        +2
        Ага, за два года разработки моделей — у разработчиков не хватило всего одной недели, чтобы доучить.
        Что-то не верится мне в такой расклад = )
          +6
          Как они говорили в трансляции, факт что зона видимости так важна они осознали когда была сыграна первая серия игр. Они добавили ограничение, и решили что после его ввода обучение нужно запустить заново.
          Возможно, разработчики неосознанно хотят чтобы их детище выиграло. Но подозревать в злонамеренной подтасовке я бы их не стал.
            +1
            Разработчики доучили 5 агентов и провели серию игр, которая закончилась со счётом 5:0 и 5:0 в пользу бота. Одинадцатая игра была с неподготовленным ботом вне шоуматча.
              0

              Не думаю что они конкретно сидели и учили ботов всей командой 2 года. Скорее костяк перехожит с проекта на проект, у них же еще Го, Дота и сворачивание белков было. Да и 90% времени ушло на тесты структуры, написания метрик и тестовой инфраструктуры. Так что да, выглядит вполне убедительно.

            0

            Тогда надо вводить ограничения на скорость переключения карты. Потому что если ограничить видимость то можно же просто сканировать карту постоянно со сверх человеческой скоростью.

              0
              Ну в обычной игре переключение карты это тоже клики, потому не нужно никаких дополнительных ограничений, разве что выделить процент кликов на переключение из общего APM. Но по хорошему и это не нужно: при «правильном» обучении смена вьюпортов должна тригерится событиями на миникарте и контролем войск во время атак, что слабо повлияет на APM.
                0
                Лим «Larva» Хон Джио трижды поиздевался над оппонентом в финале Zotac Cup Masters Showmatch по StarCraft Remastered. В первом матче он не использовал одного из рабочих, во втором он сыграл левой ногой, а посреди третьего — притворился спящим.
                –1
                Да там кучу ограничений нужно вводить. Только что сразу пришло в голову:

                1. Разумный EPM;
                2. Мисклики (некий процент) и низкая (как у человека) скорость их обнаружения;
                3. Способность контролировать несколько групп одновременно.
                4. Что-то делать с рабочей памятью. Человек не может помнить куда идёт каждый из 70 юнитов 3 групп, окруживших толпу имморталов. Бот — может. Как и точно рассчитать, успеет ли сталкер добить пилон перед тем, как к нему прибегут гости (был там такой эпизод).

                Это если ставить задачу сделать максимально «человечного» бота. У DeepMind, подозреваю, задача не такая.
                –2
                аргумент хорош, но ведь человек тоже видит все поле на миникарте
                  +7
                  нет, там только квадратики, непонятно, что это за юниты и чем занимаются
                    +2
                    нуу, не знаю, я когда играл мне понятно было примерно
                      0
                      Достаточно на пару секунд задуматься «а чем занимается вот эта точка» и уже потеря в развитии. А компьютер на такие раздумья время не тратит.
                        –1
                        Одна точка прет — разведчик. много — ломанулись атаковать. Идет точке на соседнюю базу — ее занимать. Когда ломанулись толпой атаковать, то грех не глянуть быстро переключиться, оценить кто идет.
                          0
                          Одна точка может запросто быть дропом или либератором, которые могут нанести не слабый ущерб экономике.
                            0
                            Это легко определяется таймингами который каждый профессионал отлично знает. На 20 секунде может произойти то. На 40 другое и тд.
                              +7
                              а на 10 минуте (например) это может быть что угодно
                                0
                                А на 10 минуте ты будешь ориентироваться на место где обнаружена точка. Если это в тылу возле ресурсов то практически 100% это либо харас либо харас с высадкой нескольких юнитов. Если в другом месте — это разведчик независимо от того что это за юнит
                                  0
                                  Короче говоря, важность того, что ИИ видел всю карту, сильно переоценена и проиграл этот ИИ просто из-за недотренированности или каких-то багов в версии где ему надо было скроллить
                  0
                  Тут нюанс. Противник допустим по навыкам игры как человек, но имеет х3 точность и х3 реакцию. При возможности видеть всю карту — он просто получает возможность свою х3 реакцию реализовать, за счет чего и побеждает. Если бы был лимит на пиковый AMP — он бы столь идеально контролировал 3 группы юнитов. Как и если бы ему пришлось ловить их по карте, а не видеть всех.
                    +1
                    Это на самом деле не все: то, что вы сказали надо обязательно дополнить:
                    • одной картой
                    • зеркальным матчапом (чтобы было понятно людям не в теме: противники играли одинаковым набором возможных юнитов и строений, а конкретнее протосами)

                    Устранение всех перечисленных ограничений увеличивает сложность игры нелинейно. Т.о. успех AlphaStar не стоит переоценивать, все эти крики про скайнет и прочее — это все фон и маркетинг, однако несомненным фактом остается то, что разработчики наверняка пойдут дальше и рано или поздно мы увидим много интересного уже не втиснутого в прокрустово ложе.
                      0
                      крики про скайнет

                      Учитывая «практически ничего не апгрейдил» сражение между таким скайнетом и людьми будет выглядеть следующим образом: с одной стороны люди с танками, пушками, ракетами. С другой роботы с арматурой в руках (или просто арматура с ногами :) ) и они этой арматурой разносят к чертям все эти танки и пушки.
                        0

                        Так нет же. С другой стороны человек один а все эти юниты без микроконтроля имеют интеллект как у жуков.

                      –4
                      он видел сразу все поле боя, что позволяло полноценно контролить
                      Другие боты точно так же получают информацию о всей видимой области и контролируют каждый юнит на карте. Это не особенность AlphaStar, а особенность API, который близы написали для работы ботов. Это тоже не является преимуществом и фактором победы ботов AlphaStar.
                        +1

                        Ну кстати, в последнем шоуматче бот проиграл ИМХО не из-за ограниченности экрана. В начале он всё так же вывозил на микро и получил нормальное преимущество.
                        Если бы MaNa не нашёл как вызвать deadlock у бота своим фальшивым дропом, то исход матча был бы противоположным.

                        +3
                        Вот потому сражения старкрафте и в доте с ИИ мало интересны.

                        Слишком много преимуществ от полного обзора на карте и от идеального микроконтроля на бешенных скоростях.

                        Интереснее было бы посмотреть на пошаговые игры, где от скорости кликов ничего не зависит. Но только чтобы обзор карты и ресурсов был честный.
                          +6
                          Шахматы — как пример.
                            +1
                            Шахматы не совсем удачный пример, т.к. это игра с полной информацией. Думаю можно посмотреть на успехи ИИ в области покера.
                              0
                              Зато шахматистам ИИ очень полезен. Вместо изучения сотен томов литературы, достаточно планшета, который по ходу игры будет подсказывать хорошие и плохие ходы, почти в игровой форме, далее анализ почему ход сильный или слабый. Раньше такое было невозможно.
                                0
                                далее анализ почему ход сильный или слабый
                                Анализ разве возможен?
                                  0
                                  Да, возможен. Нейросетка даёт оценку позиции же, а не выбирает следующий ход. А если есть оценка позиции — то можно следить как она изменяется в результате сделанного хода.
                                  0
                                  А зачем тогда нужны шахматисты?
                                    +1
                                    Спорт же. Снегоходы тоже быстрее лыжников, только лыжный спорт все равно остается актуальным.
                                      +1
                                      Я, честно говоря, не знаю зачем нужны спортсмены. На них даже всякую химию испытывать не дают =(
                                        0
                                        Еще как дают!
                                        Один только вид спортсменов за работой вызывает выделение литров эндорфинов в головах болельщиков.
                                          0
                                          Как говорил один знакомый спортсмен, главное, чтобы врач вовремя оказался с чемоданчиком (это о допинге и прочей химии).
                                +1
                                Пошаговые игры в лице шахмат и ГО уже давно покорены, думаю никто не питает тут иллюзий на счет возможности победы человека в них.
                                  –11
                                  Насколько я читал, шахматы не просчитаны до конца. Слишком большое количество комбинаций. И при игре в равных условиях с одинаковыми ограничениями на время хода шансы у человека еще есть. Но я могу ошибаться.
                                    +16
                                    Шахматы не обязательно считать до конца, чтобы обыграть человека.Шансов нет.
                                      +2
                                      Если ничего не путаю, то пятифигурные окончания в шахматах просчитаны все. Сейчас считают шестифигурные, но там пока завершения в обозримом будущем не видно.
                                        +4
                                        Шести и даже семифигурные окончания уже полностью просчитаны. Шестифигурные ещё в 2005 году, семифигурные в 2012. В принципе, даже восьмифигурные уже определённо по зубам современному железу.
                                          –4

                                          А теперь — задачка для средних классов физматшколы: оценить, когда при таких темпах можно ожидать 32-фигурные таблицы, и сколько места они будут занимать. При том, что с добавлением каждой новой фигуры сложность и объем данных растут экспоненциально.

                                            +6
                                            Многофигурные таблицы окончаний — это полный перебор, вот прям всех-всех-всех вариантов. Но шахматные движки так не играют.
                                            В до-AlphaZero эпоху движки использовали альфа-бета отсечения. Этого хватает, чтобы в играх на звание чемпиона мира показывать ошибки людей в real-time. В играх против компьютера гроссмейстеры из топ-20 играют с нарастающей форой: шансы на ничью появляются далеко не с первой пешки.
                                            ИИ на нейросетях (AlphaZero, Leela) делают предыдущих программ-чемпионов с крупным счетом, при этом количество анализируемых позиций у них гораздо меньше, в разы.
                                            Таким образом, несмотря на то, что полностью шахматы не решены, у человека нет шансов при игре с компьютером, даже настольным (не говоря про кластер или супер-компьютер)
                                              +5
                                              Да, естественно. Сила игры компьютера против человека, вопреки обывательским мифам, вовсе не в том, что он «помнит все варианты». Я, как автор шахматной программы уровня 2700 CCRL, слегка в курсе того, как они устроены :))
                                      0
                                      Моя идея именно в просмотре матчей против ИИ в современных пошаговых играх, вроде цивилизации. Там же число комбинаций очень огромно и простым перебором эдшпилей не отделаешься.
                                        +2
                                        AlphaZero в прошлом году победила с разгромным счетом программу, работающую пересчетом, которая считается сильнее чемпионов мира среди людей (собственно со времен Каспарова, люди с программами уже всерьез не играют). А ее дебюты с большим интересом изучают живые шахматисты.
                                        Только до Цивилизации, боюсь, этот ai нескоро дойдет — слишком партии длинные. Да и поиграть с ним нельзя — работает где-то в гугловском кластере, и для простых смертных недоступен.
                                        –5
                                        Вот только покорялка требует, заоблачных мощностей. По сути, там тоже бот побеждает механикой: моделирует все варианты наперёд и выбирает те, где больше благоприятных вариантов. Люди так не делают и не могут. Алгоритма игры в шахматы, побеждающего людей, ещё не написано и не планируется.
                                          +4
                                          Не совсем так.
                                          Во-первых, заоблачных мощностей не надо: современного домашнего компьютера хватает, чтобы обыгрывать гроссмейстеров. С помощью старой доброй Stockfish, без нейросетей.
                                          Во-вторых, бот перебирает далеко не все варианты.
                                          В-третьих, Leela Zero перебирает гораздо меньше вариантов, чем тот же Stockfish. В разы меньше.
                                          В-четвертых, люди играют в общем-то так же: они считают варианты. По послематчевым комментариям топ-гроссмейстеров видно, что они рассчитывают позиции на 5-10 ходов. В середине игры. Чем меньше фигур, тем дальше могут считать.
                                          Сильный шахматист точнее оценивает позицию и считает только перспективные варианты. Раньше люди оценивали позицию лучше компьютера, но сейчас позиционно переиграть движки не получится.
                                          В-пятых, программа — это закодированный алгоритм. По определению. И есть десяток программ, не основанных на нейросетях, написанных 10+ лет назад, которые побеждают людей. С внятным алгоритмом, понятным его создателям.
                                        –2
                                        Все-таки, в доте тактика и стратегия решают намного сильнее, чем механические скиллы. В отличие от старкрафта, видимо — за него говорить не могу, поскольку не играл.
                                          +1
                                          ну то что я видел в исполнении бота на SF — было перебором. Там скоростной микроконтроль отъедал весь фарм и шансов у человека фактически не было.
                                            0
                                            Ну так это как раз и было демонстрацией механических скиллов, и именно поэтому пришлось зарезать все возможности тактики/стратегии: 1х1, одинаковые герои, половину предметов нельзя покупать. Потому что скоординированные пять человек, которым позволили самим набирать себе героев, открутили бы этому боту голову, не посмотрев на нечеловеческий ластхит.
                                            Upd: Извиняюсь за плохую формулировку — пять человек, разумеется, пяти таким ботам головы бы открутили, а не одному.
                                              0

                                              С ограниченным пулом 5-ых игроков в доте уже обыграл OpenAi. Ещё летом.

                                                +3
                                                С очень ограниченным, обыграл только в первый раз и игроки были далеко не топ, так ведь было?
                                            0
                                            При кривых руках никакая тактика не поможет.
                                              0
                                              При полном непонимании игры не поможет никакой ластхит и умение нажимать кнопки. Что толку от фарма и точных скиллшотов, если ты, например, не можешь оценить опасность и вовремя свалить с линии?
                                                0
                                                Должно быть как и понимание, так и прямота рук. В саппорте не обязательна быстрая реакция, однако при кривости рук можно было слить всю команду одним кликом.
                                                  0
                                                  С большинством игроков так и происходит в общем-то, поэтому и существует “elohell”
                                                0
                                                В доте не умея ластхитить на ладдер лучше даже не заходить. В Старкрафте можно не уметь кайтить и сплитить войска — и всё равно побеждать в низких лигах.
                                                  0

                                                  "в низких лигах" — это вплотную до мастер лиги?

                                                    0

                                                    В целом есть примеры людей, которые побеждают в гранд-мастер лиге по F2.

                                                      0
                                                      Если хорошо «читать» билд соперника и уметь в макро(оптимизировать экономику, правильно выбирать билдордер и апгрейды, знать контрпики) то 6000 ммр покорить вполне реально, а это уже грандмастер лига. И хорошее микро(кайт, сплит) будет не нужно.
                                                    0
                                                    Думаю, игру под обсуждаемый кейс придется проектировать специально. Dota тоже не годится…
                                                    +3
                                                    Героев 3 посмотреть бы
                                                      +3
                                                      Это будет что-то похожее на игру в Rogue экспертной системы, созданной ещё в начале 80-х. Безо всяких нейронных сетей были показаны результаты, намного превосходившие лучшие достижения человека.
                                                        0
                                                        Если предобучать сетки с использованием большого количества партий людей, как это сделали для AlphaStar, и потом оставить ИИ вот так тренироваться с самим собой, то может получться очень сильный ИИ. Было бы намного интереснее попробовать обучить агента с нуля, чтобы он изобретал абсолютно новые способы игры и т.п.
                                                        Герои ещё и с инженерной точки зрения намного сложнее. В SC2 все действия можно сгенерировать с помощью двух-трёх «голов» у нейронной сетки, а в Героях придётся ещё как-то кликать по менюшкам, городам, героям, передавать артефакты и т.п. С технической точки зрения это все непросто.
                                                          +1
                                                          На шахматах пробовали. ИИ просто с нуля переизобрёл большинство перспективных гамбитов. Что доказало, что люди — тоже не идиоты… но и всё.
                                                            0
                                                            Ну про шахматы все знают, но принято полагать, что в SC2 побольше простор для разнообразия стратегий.
                                                          +1
                                                          Третьи герои слишком прямолинейны и не сбалансированы. Посмотреть, конечно, интересно, но это ничего не даст.
                                                            0
                                                            В смысле прямолинейны и сбалансированы? Посмотрите хотя бы пару партий на соревновательном уровне. Стратегия и тактика там будут похлеще Старкрафта: цепи, мувпоинт менеджмент, бои, давление на оппонента. Вот первая попавшаяся партия, думаю вам будет интересно www.youtube.com/watch?v=MnZzrdt9r_k
                                                          +1
                                                          Ну не знаю, по ходу и в HMM3 например, такой ИИ тоже разорвет любого игрока. Единственное что там может смутить высокий % вероятностных решений.
                                                          +30

                                                          Ребята, ну чего вы привязались к APM. Ну да, эта проверка, эта демонстрация не показала, что AI может обыграть человека, играя на равных. Ну и что. Даже если бы там был жёсткий лимит на мало действия в секунду — всё равно было бы несложно найти ещё десяток вещей, которые AI делает нечеловечески хорошо — "а вот он слишком точно попадает по пикселю", "а вот он посмотрел на нужную постройку в слишком подходящий момент времени", "а вот он слишком быстро перевёл взгляд из левой половины экрана в правую", "а вот он подумал больше мыслей в секунду чем способен самый быстромыслящий человек" — это можно бесконечно регулировать и балансировать. Зато уже произошла куча вещей, которые, ну, офигенны!:


                                                          • Впервые AI хоть как-то обыграл человека в эту игру, и в целом хоть в какую-то игру такого рода. Предыдущие жалкие попытки были абсолютно жалкими, даже при неограниченном APM. Меня это восхищает просто даже как человека, в своё время потратившего ну где-то годик человекочасов на разработку AI для RTS.
                                                          • Из этого AI уже сейчас можно извлекать теоретические знания об игре, полезные для людей. Даже просто вот это наше overprobing — смотрите как Beastyqt (в своё время один из топовых игроков) минут 5 недоумевает, как мы раньше до этого не додумались [1]. Это вот, если угодно, пример чисто человеческого, человекопонятного вместе с объяснениями и доказательствами знания, добытого машиной — много вы такого знаете? Люди были настолько уверены, что этого не может быть, что даже в игре специально сделали подсветку красным, но сейчас они признаются, что возможно они восемь лет играли неправильно в одном из совершенно базовых аспектов. А это ещё только один match-up на одной карте. Также мне, например, очень любопытно, изобретёт ли AI новые пригодные для человеческого использования механики (паттерны кликания мышкой), если продолжать ему урезать APM, зону видимости, вот это всё.
                                                          • Это офигенно в том числе и чисто эстетически. Это событие — примерно как если бы мы встретились с расой инопланетян ("агенты" выведены же чем-то вроде генетических алгоритмов) и поговорили с ними на нетривиальную, интересную и, я бы даже сказал, вполне гуманитарную тему и узнали что-то новое. Произошло, если угодно, культурное обогащение человечества из какого-то внешнего относительно человечества источника. А вы тут только и думаете, что "ну у них было больше щупалец, поэтому они и выиграли". Какая разница, кто выиграл. Люди повстречали какую-то новую форму жизни — и не просто повстречали, а создали сами — которая мыслит совсем не так как мы, но тоже каким-то понятным образом, и с ней есть о чём поговорить!
                                                            +3
                                                            > я бы даже сказал, вполне гуманитарную тему и узнали что-то новое

                                                            Насколько я понял из комментариев к играм, новое-то как раз и не узнали. Никаких нетривиальных стратегий машина не продемонстрировала. В отличие от тех же шахмат и го.
                                                              +1
                                                              Посмотрите видео Beastyqt, он как раз размышляет о том, что ИИ играл в 3 барака, 2 старгейта, сталкеры + фениксы. Он прям так и говорит: «Если бы мне кто-то сказал, что это лучшая стратегия в пвп, то я бы сказал, чувак, ты тупой».
                                                                +1
                                                                Обсуждали же, что такая стратегия для людей бесполезна — не смогут они физически так микрить этими юнитами, чтобы это стало лучшей стратегией в пвп.
                                                                  0
                                                                  А можно ссылку, пожалуйста, или более развернутый ответ. Чем вы хотите контрить эту стратегию и зачем вам так нужно запредельное микро для этой стратегии?
                                                                    +2
                                                                    Более развернутый ответ. Разные юниты имеют разный потенциал микроконтроля, т.е. полезность одних от качества контроля почти не зависит, например carrier, у других, наоборот, сильно растет, например zerling, marine, stalker.
                                                                    Игра балансировалась под живых людей, у который есть определенный предел, выше которого они полезность юнитов повышать не могут.
                                                                    Если этот предел превышается — баланс меняется, и это видно на примере тактики масс-сталкеров, бесполезной в условиях ограниченного контроля.
                                                                  +2
                                                                  ну дык если ты можешь так эффективно блинкать сталкерами, то отличная стратегия
                                                                +1
                                                                Каким образом у него получелось сделать overprobing? Я не специались по SC2. Помню, по SC:BW, что если уничтожат пилон, то все юниты перестают строится, пока не будет нужного количества пилонов.
                                                                  0
                                                                  Под overprobing имелось в виду, что бот строил на несколько пробок больше считавшегося оптимальным количества (по 2 пробки на минерал).
                                                                    +3
                                                                    Каким образом у него получелось сделать overprobing?

                                                                    Пока рабочий сверлит минерал второй рабочий несёт добытый ресурс на базу или идёт обратно. Сверлить один минерал вдвоём нельзя. Но некоторые кучки минералов немного дальше от базы, чем другие и пока второй рабочий ходит первый успевает досверлить и тоже отправляется в дорогу и какое-то небольшое время никто не сверлит такой минерал. Считалось, что эти «простаивающие» минералы — не такое большое дело, и не окупают дополнительных рабочих.
                                                                      0

                                                                      Как мне кажется, смысл не в добыче чуть большего количества минералов, а в том, что когда у тебя 25 рабов потеря 5 из них практически не снижает скорость добычи, а переход на вторую сопровождается скачкообразным ростом добычи.

                                                                        0

                                                                        Ну старкрафтер Beastyqt считает, что это побочный эффект. А у нейросети мы спросить не можем. Интересно, создаются ли где-то нейросети, способные обучившись обосновать свои действия?

                                                                          +3
                                                                          Современные нейросети работают по тому же принципу, что и эволюция. Ответ на этот вопрос очевиден… Данная линия поведения приносила больший процент успеха.
                                                                            0
                                                                            Да, для медицинских применений активно разрабатывается это наравление. Т.к. никто не хочет лечить живых людей по диагнозу и рекомендациям, поставленным «черным ящиком». И некоторые подвижки вроде есть.
                                                                              +1
                                                                              Это стандартное заблуждение.
                                                                              Мы можем спросить у нейросети, но получить качественный ответ на этот вопрос — часто отдельная сложная задача (см. способ 1) или дополнительная нагрузка на железо (см. способ 2).
                                                                              1) Например, вместо классификации «на картинке — котик/собачка» производится детекция или сегментация: «собачка — здесь, кошечка — вот там и вот там».
                                                                              2) Упрощённый вариант детекции/сегментации выдаёт сама нейросеть в процессе обратного распространения ошибки. Есть способы этот вариант улучшить разными методами (без тренировки другой нейросети).
                                                                            0
                                                                            Считалось, что эти «простаивающие» минералы — не такое большое дело, и не окупают дополнительных рабочих.
                                                                            Вообще окупают, но гораздо дольше обычно добывающих рабочих. В одиночной игре и коопе строить больше рабочих — обычное дело. Возможно, свой вклад добавляет перевод на новую базу.

                                                                            Тут скорее дело в том, что два зонда — это один зилот. И этот зилот может иметь большее значение в сражениях в начале игры, когда юнитов ещё мало. 8 лишних зондов — это 400 минералов. Стоимость нексуса для того же экспанда или трёх-четырёх юнитов. Возможно, ИИ ещё не дошёл до ситуации, когда это важно, как, например, и до важности стенки.
                                                                              0
                                                                              кстати интересно сравнить эффективность вариантов с переходом на вторую базу с 21-го рабочего или раньше. Возможно первый вариант более эффективен только для стратегии, использованой ботом, и не подойдет для человеков.
                                                                          +16
                                                                          Ну да, эта проверка, эта демонстрация не показала, что AI может обыграть человека, играя на равных. Ну и что.

                                                                          Проблема не в этом, а в том, что и сами DeepMind и журналисты в интернетах поспешно презентуют это именно как безусловную победу AI при игре на равных, а не как лишь предварительный результат при большой форе у AI. Проблема в несоответствии заявляемого и действительного. Это fraud, фальсификация, введение в заблуждение, «эксперимент поставленный нечистыми руками».


                                                                          То есть, никто не умаляет заслуги DeepMind в том что они смогли представить первого бота который хоть как-то смог обыграть человека в SC, но то как это было подано — это вызывает возмущение.


                                                                          Такие вещи (поспешная презентация достижений которых еще нет) происходят нередко, и очень вредят науке и прогрессу. Потому что теперь все будут считать что задача уже решена, хотя она еще не решена. И если завтра кто-то сделает более «трушный» AI для SC, никому до этого уже не будет дела, мол, «мы это уже видели». Собственно, это и демотивирует даже пытаться делать это, потому что кто-то уже получил лавры (пусть и незаслуженно) за решение этой проблемы.


                                                                          DeepMind следовало бы признать свою ошибку и выступить с публичными разъяснениями. Если они этого не сделают, я глубоко разочаруюсь в их команде.

                                                                            0

                                                                            Среди киберспортсменов в SC2 так же у кого-то микро лучше, у кого-то хуже, зато вытаскивает на понимании игры и оригинальных билдах. До этого матча не было вообще ботов без явных читов (бесконечные ресурсы/мапхак) способных стабильно обыгрывать киберспортсменов. Теперь есть. Бот играет в рамках правил которые установили Близы (тулкит для ботов они выпустили официально), спортсмены играют в рамках тех правил которые установили те же Близы (механика иры, запреты на макросы). Если я буду играть в против вас и мой APM будет выше — исгра сразу станет нечестной?

                                                                              +1
                                                                              Вот только для Близы регулярно вносят дополнения в свои правила в попытках сбалансировать игру и сделать её интереснее. Так почему вы считаете, что правила для ботов в таких уточнениях не нуждаются?
                                                                                +1
                                                                                Нет, а вот если один грает на модеме 56к из 90х а другой на оптике недалеко от магистрали то явно нечестной.

                                                                                У бота совсем другая скорость интерфейса ввода/вывода с игрой. Там и зумхак (вроде как признаный а вроде и довольно тихо) и произвольное выделение юнитов (без контролок и не «квадратом») и выделение строений на которые вообще ни разу не смотрел экран.
                                                                                  +1
                                                                                  Бот играет в рамках правил которые установили Близы (тулкит для ботов они выпустили официально), спортсмены играют в рамках тех правил которые установили те же Близы

                                                                                  Если вы будете демонстрировать такой микроконтроль на ladder, на вас нажалуются и забанят за читы (на ютубе полно видео таких читеров). Поэтому бот как раз играет не по правилам. Правила это не «то, что позволяет делать API», это несколько больше. Просто на уровне API нет было смысла вводить дополнительные ограничения, которые и так продиктованы мышечно-моторными возможностями человека. Игра сбалансирована под эти неявные моторные ограничения, они являются частью правил. Абилки разных юнитов, их характеристики — все это тонко настроено именно под то, что вы управляете игрой через мышцы, мышь и клавиатуру.


                                                                                  Если я буду играть в против вас и мой APM будет выше — исгра сразу станет нечестной?

                                                                                  Если ваш APM будет выше того, что могут в принципе делать люди — то да, она сразу станет нечестной и вас забанят. Это происходит постоянно, кстати. Дело в том, что если ваш APM слишком высок, то никакие «оригинальные билды» оппоненту не помогут выиграть, вы можете задавить его тупо механикой в 100% случаев, если у вас есть хотя бы минимальное понимание игры.


                                                                                  у кого-то микро лучше, у кого-то хуже, зато вытаскивает на понимании игры и оригинальных билдах

                                                                                  Прекрасно, значит пусть бот «вытащит» на понимании игры и оригинальных билдах. Сделаем ему эффективный APM даже чуть ниже чем у человека, чтобы ни у кого не было сомнений, что дело не в моторных преимуществах!


                                                                                  А если бот не сможет победить в таких раскладах — значит, не очень-то он и интеллектуален. А ведь именно это мы и пытаемся выяснить — есть там превосходящий человека интеллект или нет.

                                                                                +2
                                                                                AI не изобрел overprobing и не добыл никаких знаний по нему.

                                                                                Вот вполне стандартная статья на аналоге википедии, вот обсуждение на реддите трехлетней давности. Помню что winter видео от которого есть в статье рассказывал это в одном из своих гайдов.

                                                                                В общем-то ставить на базу больше рабочих чем положено подсказкой — стандартная практика.
                                                                                  0
                                                                                  Так вот в той статье ошибочный график. Он после 16 падает, а если правильно оптимизировать добычу, то полка.
                                                                                    +2
                                                                                    А можно ссылку на видео с такой стандартной практикой, где игрок массит рабочих до 21 и только потом ставит экспанд? Да, знания были, и от случая к случаю игроки делают больше 16 рабочих, но стандарта такого, что обязательно нужно раскачать базу до 21 рабочего — нет.
                                                                                    +2
                                                                                    Впервые AI хоть как-то обыграл человека в эту игру, и в целом хоть в какую-то игру

                                                                                    такого рода.
                                                                                    OpenAI в доте?
                                                                                    AI сделанные без машинного обучения?
                                                                                    Есть сообщество которое соревнуется в "ботостроении" на основе первого старкрафте и показывают хорошие результаты, но обыгрываются профессионалами банальными тактиками, наподобие той, которой победил MaNa (варп-призма + обс)


                                                                                    Даже просто вот это наше overprobing

                                                                                    Я все ещё не определился — это баг, связанный с тем что они сначала специально тренировали только на добыче минералов (см. Материалы на их сайте) без "настоящих матчей" или они просто приспособились играть друг против друга ("мета", "баланс" и "стратегии" зависят в большОй степени от игроков) — потому что отличный контроль при атаке приведет к убийству рабочих.
                                                                                    Так же по поводу баланса — взгляните на юнитов которых строил бот — сталкер или сталкеры + дизрапторы — он тоже о многом говорит, так как эти юниты при нечеловеческом контроле гораздо лучше.
                                                                                    Я это к тому что люди у него не многому научатся. Его тактики — это тактики для идеального контроля, который пока ни один игрок в мире не может осуществить(и возможно не сможет никогда)
                                                                                    Также, по поводу "учиться у бота" — насколько ужасные размеры были в узких проходах — это отдельный разговор. Это такая ошибка, которую увидели игроки всех уровней.


                                                                                    Это офигенно в том числе и чисто эстетически.

                                                                                    Просто бот vs человек с огромной долей хайпа. Опять же посмотрите на любительских ботов для первого ск. Некоторые вещи они делают лучше, а как показала последняя игра с MaNa — он подвержен некоторым таким же хитростям

                                                                                      +1
                                                                                      Я конечно извиняюсь, но еще во времена первого старкрафта было досконально изучено, сколько пробок сколько майнят минералов, я лично помню обсуждения в RU.STARCRAFT. И делать рабочих больше разумного количества придумали еще тогда, в прошлом веке — не обязательно как защитный маневр, но и чтобы после постройки «экспаншна» сразу перевести лишних туда.
                                                                                      Господин стример, вероятно, утрирует для определенной манипуляции своей аудиторией, чтобы удержать их интерес.

                                                                                      Мне больше интересно, как так вышло, что кучка из 15-20 голых «дизраптеров» — это внезапно выгодная стратегия.
                                                                                        –1
                                                                                        Так ведь новизна в том, что при «бОльшем разумного» добыча на рабочего не снижается. Специально выверенные тайминги позволяют трём рабикам добывать с дальнего минерала не мешая друг другу.
                                                                                          0
                                                                                          Доказательств этому утверждению нет. Теоретически это возможно на какой-то конкретной карте, хотя бы даже и той, которую использовали в тесте, но я сильно сомневаюсь.

                                                                                            0
                                                                                            Что значит нет, откройте продакшен в реплее и посмотрите: 16 рабочих — 900 минералов в минуту, 21 рабочий — 1000 минералов в минуту.
                                                                                              0
                                                                                              По вашим же цифрам очевидно что добыча на рабочего как раз таки снижается. Если бы нет, то 5 дополнительных рабочих работали бы так же эффективно как и все остальные, а дальше математика школьного уровня. То, что добыча в сумме увеличивается не значит что она остается такой же для каждого отдельного рабочего.
                                                                                                0
                                                                                                Извиняюсь, неправильно понял утверждение, думал что нет доказательств тому, что 21 рабочий добывают больше минералов, чем 16. Доказательство этому есть, но прирост добычи в разы меньше, чем между 11 и 16.
                                                                                          +1
                                                                                          Никто не говорит о том, что игроки не знали, что 21 рабочий приносит больше минералов, речь о том, что ИИ в каждой игре строил 21 рабочего до постановки экспанда, чего не делает никто. ПЛЮС после хараса и убийства 3-5 пробок, ИИ их не достраивает, потому что он почти не проседает по экономике, т.к. остается с 16 рабочими, в стандартном же случае у игрока бы осталось 11 рабочих, что привело бы к 50% потери добычи, что равно проигрышу.

                                                                                          Мне больше интересно, как так вышло, что кучка из 15-20 голых «дизраптеров» — это внезапно выгодная стратегия.

                                                                                          Дизрапторы там из предпоследнего патча, когда взрыв шара происходит при столкновении с юнитом. KingCobra играл в фениксы+дизрапторы против террана в том патче, так что вот тут, как раз, ничего нового ИИ не октрыл.
                                                                                          0
                                                                                          Из этого AI уже сейчас можно извлекать теоретические знания об игре, полезные для людей.

                                                                                          То же самое с Го было, даже в более чистом виде, так как обучение игре шло с нуля
                                                                                          habr.com/ru/post/373919
                                                                                          … В своей работе разработчики замечают, как AlphaGo Zero постепенно сама изобрела некоторые дзёсэки (дебютные комбинации), включая одну комбинацию, которая встречается в профессиональной игре.

                                                                                          По новинкам в дебютах: как и в прошлых партиях альфа-ли и альфа-мастер мы встречаем ходы, которые люди считали плохими. Я уже 15 лет преподаю го и вспоминаю, что ругал своих учеников за такие ходы. Сейчас все профессионалы го пытаются их копировать, даже гордые японцы, которые редко брали на вооружение китайские и корейские новинки. Все согласны с тем, что идеи «Альфы» мощные, никто даже не пытается из опровергнуть.
                                                                                            0
                                                                                            Поселе матча с Седолом (там где он героически вырвал одну победу) — были сомнения.

                                                                                            После того, как «Мастер» образцово-показательно «вынес» всех чемпионов, каких встретил — сомнения отпали.
                                                                                            0
                                                                                            Это событие — примерно как если бы мы встретились с расой инопланетян («агенты» выведены же чем-то вроде генетических алгоритмов) и поговорили с ними на нетривиальную, интересную и, я бы даже сказал, вполне гуманитарную тему и узнали что-то новое.

                                                                                            Гм
                                                                                            Я правильно понимаю, что все правильные вопросы придумали разработчики обучающей программы: на какие аспекты поведения живых игроков следует обратить внимание, из каких аспектов состоит стратегия игры, а как характеризуется игровая ситуация? Ошеломляют стримеров — ответы, но ответы даёт тоже не «самообучившаяся машинка» и никакой не «хаос». Отвечает статистика, отвечают (неосознанно) те самые участники тысяч просмотренных матчей.
                                                                                            Насколько я понимаю, инопланетянами, получается, являются программисты, которые придумали, как и какую статистику собрать. Не опросом участников тысяч матчей — статистику их неосознанных и случайных действий. Круто, скорее, то, что эти инопланетяне скорее всего знают о Старкрафт больше, чем авторы игры из «Близзард», но ведь это нормально, когда критик знает о литературе больше писателя, например. :)
                                                                                            (это если дело не в микроконтроле. ))
                                                                                              +1

                                                                                              Не совсем. Первый этап просмотры матчей — второй игры внутри ИИ, в этих играх проходит аналог эволюции. Как вывести мышь для жизни на Марсе рассуждениями учёных, а потом забыть ее там на сто тысяч лет. Когда ее снова найдут — мышь эволюционно приспособится к условиям планеты и выведет новые качества о которых никто не думал)

                                                                                                –2
                                                                                                Не выведет. Не приспособит. Без Творца — никто ещё не доказал, что работает.
                                                                                                Но дело даже не в этом.
                                                                                                Что значит — просмотры матчей? Какую информацию считать важной, какую второстепенной — определили программисты ИИ. Как понять, что тот игрок победил, а этот — проиграл — подсказали программисты, но это уже несложно.
                                                                                                Я говорю о постановке вопросов.
                                                                                            –1
                                                                                            Вроде бы тут уже обсуждалась статья Хомского по поводу AI и как мы далеки от него. То что нам демонстрируют сегодня это просто жалкая фикция не стоящая даже обсуждения.
                                                                                            www.theatlantic.com/technology/archive/2012/11/noam-chomsky-on-where-artificial-intelligence-went-wrong/261637
                                                                                              0
                                                                                              Тут представлена точно обратная точка зрения
                                                                                                +2
                                                                                                Все несколько сложнее…

                                                                                                Хомский говорит об «интеллектуальных» системах типа IBM-овского Ватсона, которые дают ответы на естественных языках, используя статистические модели и семантический анализ. В этом он прав — Ватсон действительно не понимает о чем говорит. Он «всего-лишь» подбирает ответ, который больше всего подходит по некоторым калибровочным параметрам. В кавычках — потому, что сама процедура «подбора» довольно нетривиальна и дает результаты, которые кажутся фантастическими. Но это лишь видимость интеллектуальной деятельности.

                                                                                                А вот игры, особенно с полной информацией, такие как шахматы и го — это качественно иной подход. Там, условно «знание правил» вполне возможно, т.к. конечно. И ИИ знает об игре ровно столько же, сколько игрок-человек. Последние агенты по игре в шахматы/го обучались игре не на примерах игр людей, а сами с собой, т.е. у них не было ничего, кроме правил и возможности играть. И они научились так, что у людей больше нет шансов. Они переоткрыли заново закономерности, на которые людям понадобились тысячи лет, за несколько дней (с учетом их скорости это примерно тоже самое).

                                                                                                В моем понимании такие вот игровые движки гораздо ближе к интеллекту, чем Ватсон.

                                                                                                Кроме того, есть еще один интересный момент: по английски эта область называется AI, что расшифровывается, как Artificial intelligence, где второе слово, не совсем интеллект. ;) Это буквально можно перевести, как «интеллектуальная деятельность». Они как бы сразу на интеллект не замахиваются, хорошо это или плохо…
                                                                                                  +1
                                                                                                  Он «всего-лишь» подбирает ответ, который больше всего подходит по некоторым калибровочным параметрам

                                                                                                  Мозг делает то же самое в фоновом режиме. Проявляется в форме озарения. Как при открытии таблицы Менделеева, например. Мозг перебирает комбинации в виде абстрактных образов и при появлении интересного результата перекидывает его в сознание для проверки или реализации. То же самое когда вспоминаешь чье-то имя или «где я его видел», результат индексирования БД может вернуться тогда, когда уже и не нужно. При игре в шахматы так же примерно, по крайней мере у новичков, перебираются все варианты на 1-2 шага, сначала всё важное вокруг ключевых фигур, потом вокруг всякой мелочи, отсеивая совсем бесполезные ходы.
                                                                                                  Просто наблюдаю, что много общего у искусственных нейронных сетей, и биологических. Такой же поиск локального или глобального минимума ошибки в многомерном пространстве вариантов.
                                                                                                  А что такое человеческий интеллект уже другая тема. Возможно просто глюк, «фича», который мы считаем чем-то важным. Необходимость живого понимания или осознания, против эффективных алгоритмов ИИ.

                                                                                                  Они переоткрыли заново закономерности, на которые людям понадобились тысячи лет, за несколько дней

                                                                                                  Тут отдельная интересная тема, как эти закономерности извлечь. При игре в Го их просто наблюдали по ходу игры. Но, уверен, в глубинах нейросетей ИИ таких интересных закономерностией в тысячи раз больше. Можно сотни книг по ним написать, про разные предельные случаи игр, интересные ситуации и приемы, закономерности, которые просто не всплыли в играх за ненадобностью.
                                                                                                    0
                                                                                                    --
                                                                                                      –1
                                                                                                      Мозг делает то же самое в фоновом режиме.


                                                                                                      Не то же самое, в том-то и дело. Ватсон работает по принципу китайской комнаты — он не понимает, он подбирает по параметрам.

                                                                                                      АльфаСтар понимает игру ровно в том же объеме, что игрок-человек. По сути он проходит (или почти проходит) тест Тьюринга в рамках возможностей игры (если исключить чат и сверх быстрый АПМ). Т.е. играя с ним и не имея возможности использовать чат — только по его поведению в игре вы не сможете определить — человек на той стороне или ИИ. Может быть сейчас это верно еще не на 100%, но уже очень близко к тому. И со временем — они этого точно добьются.
                                                                                                        +1
                                                                                                        он не понимает, он подбирает по параметрам.

                                                                                                        Понимание — это тонкая тема. Я вот тоже не понимаю, как я отличаю буквы, например. И я помню, что было время, когда я их не различал. И некоторрые буквы путались у меня в голове, когда я учился читать по букварю.
                                                                                                      –1
                                                                                                      В моем понимании такие вот игровые движки гораздо ближе к интеллекту, чем Ватсон.


                                                                                                      Движок просто выполняет вычисления по довольно несложной формуле (но с огромным числом параметров) с большим числом входов и выходов. Обучение — подбор константных параметров в формуле. До интеллекта в вашем понимании тут очень далеко.

                                                                                                      Сейчас принято делить весь AI на сильную и слабую формы. Вот AlphaStar — это слабая форма искусственного интеллекта. И в такой форме AI массово применяется.
                                                                                                      А как сделать сильную форму — пока не понятно. И в общем не понятно, а нужно ли.
                                                                                                      Есть мнение, что единственная известная нам сильная форма, естественный интеллект человека, развилась для социализации и общения с себе подобными. Зачем нам AI который будет котиков во вконтакте постить?:)
                                                                                                        0
                                                                                                        Движок просто выполняет вычисления по довольно несложной формуле
                                                                                                        — вы это заявляете на основании какой-то конкретной информации о работе движка, или это ваше предположение?

                                                                                                        Я согласен, что в данном случае имеет место быть слабая форма, т.е. движок решает конкретную практическую задачу и не является универсальным. Вопрос в другом: сугубо в рамках этой задачи можно ли сказать, что он работает так же, как мозг человека? Т.е. что он проходит усеченный тест Тьюринга (т.е. такой тест, в котором возможность взаимодействия с ним ограничена логикой игры)? Вполне допускаю, что нет. Пока нет…

                                                                                                        Но думаю — недолго осталось.

                                                                                                        В тех же Шахматах и Го скорее другая проблема — там можно понять, что на той стороне не человек, но уже потому, что он слишком хорош! Т.е. превосходит человека.
                                                                                                          0
                                                                                                          На основании конечно же. Движок использует обучение с подкреплением и реализован на библиотеке TensorFlow с ускорением на TPU (Tensor Processing Unit) — обе разработки Google. Собственно библиотека — целиком про операции над матрицами, а TPU позволяет их очень быстро и экономично в плане электричества перемножать. Обучение сводится к подбору коэфициентов множителей во всех ячейках.

                                                                                                          Вокруг еще много всяких «костылей», но в основе математика довольно тривиальна (с нетривиальным результатом).

                                                                                                          Насколько я знаю, большинство ученых считает, что слабая форма ИИ сама по себе — тупик. Экстенсивного перехода от нее к сильной нет, нужно менять подходы.

                                                                                                          P.S. На мозг это похоже довольно слабо. Да, имеется некая вырожденная концепция «нейрона», но совсем абстрактная, в виде двух чисел и функции порога активации.
                                                                                                            0
                                                                                                            На мозг это похоже довольно слабо

                                                                                                            Ну распишите фундаментальные отличия. Я вот читаю, как раз книжку про нейроны и там тоже каких-то чудес в самих нейронах нет
                                                                                                              0
                                                                                                              Ну например «схема соеденений» не меняется никогда в отличии от мозга. Т.е. это имитация, но очень упрощенная, на уровне концепции.
                                                                                                                0
                                                                                                                Ну например «схема соеденений» не меняется никогда в отличии от мозга.

                                                                                                                Ну так разве это фундаментальная разница? В мозгу схема соединений тоже ведь не меняется в процессе мышления особо. Да и сделать сеть с изменчивыми «соединениями» тоже не проблема. Вот, например, Dynamically Expandable Neural Собственно вес в обычных нейронных сетях во многом аналогичен этой функции
                                                                                                            0
                                                                                                            В тех же Шахматах и Го <...> можно понять, что на той стороне не человек, но уже потому, что он слишком хорош!
                                                                                                            Это зависит от разности уровней. С точки зрения шахматиста-второразрядника, игра против компа или против гроссмейстера не отличается: противник слишком хорош, и по грубым прикидкам (разница в рейтинге -> шанс выиграть) игра идет в одни ворота. То есть для большинства шахматистов, отличить бота от Карлсена будет крайне трудно.
                                                                                                            При этом работает он точно не так же, как мозг человека.

                                                                                                            Ну и к тому же, и AlphaStar, и Stockfish написаны не с целью пройти усеченный тест Тьюринга. Если это и случится, то как побочный эффект.
                                                                                                      +1
                                                                                                      В идеальной ситуации нужно предоставлять равные условия обоим игрокам — чтобы вывод информации был только на экран, а ввод только через стандартные интерфейсы ввода (со всеми их ограничениями вроде невозможности клика в другой точке без реального перемещения курсора)
                                                                                                        +3
                                                                                                        Ну и так очевидно, что роборука будет двигать мышку быстрее и точнее, чем человеческая. Получается только бессмысленное усложнение, не имеющее отношения непосредственно к AI.
                                                                                                          +1
                                                                                                          Почему бессмысленное? Например — нужно указать двум юнитам атаковать двух вражеских юнитов, каждый атакует своего. Для человека порядок будет такой — выделить одного юнита, перевести курсор на врага, кликнуть, перевести курсор на второго юнита, кликнуть, снова перевести курсор уже на другого врага и снова кликнуть. Какая бы быстрая рука не была у живого игрока, это в любом случае миллисекунды на перемещение курсора. Как я понял, AI же отдает команды в виде «курсор на координаты x1,y1; клик; курсор на координаты x2,y2; клик» и т.д., то есть курсор переносится как бы моментально и точно в нужные координаты. Если юниты находятся рядом, то еще куда ни шло, а если они на разных концах экрана? Человеку нужно как минимум 3 раза полностью пересечь курсором экран (а точность движений человека больше в центре экрана и падает к краям), плюс неизбежный лаг зрения и нервных реакций, которых лишен AI. Разница может быть в миллисекунды, но за всю игру она накапливается.
                                                                                                          Если цель стоит в том, чтобы сделать молотилку, которая «закликивает» противника, то это уже удалось. Если же цель в том, чтобы создать более-менее равные условия для игрока и бота, нужно вводить все эти поправки. И тогда боту для победы нужно будет обучаться стратегии, а не микротактике.
                                                                                                            +1
                                                                                                            Если цель стоит в том, чтобы сделать молотилку, которая «закликивает» противника, то это уже удалось.
                                                                                                            Только эта «молотилка» строит базы, разведывает, харасит, отступает, разводит. А кликает всего в два раза больше, а лучше? Если уж прогеймеры делают бессмысленные и бесполезные клики, то почему мы считаем, что клики бота все полезны? Кликающих молотилок было не мало, и кликали они на порядки больше, только толку это не даёт. Альфастар это прорыв по всем аспектам игры, где-то больше, где-то меньше.
                                                                                                          –3
                                                                                                          А вы понимаете, что там соревновались человек и бот? А вы понимаете, что человеку будет несколько неудобно пользоваться API, который Близард сделали как «стандартные интерфейсы ввода» для ботов? С каким счётом проиграл бы Мана при игре через API для ботов?
                                                                                                          Надо разделять — человеку монитор и мышку, а боту — API.
                                                                                                            0
                                                                                                            Думаю, имелось в виду заставить бота работать через человеческие интерфейсы)

                                                                                                            Marsiforming
                                                                                                            xkcd.com/2095
                                                                                                              +1
                                                                                                              Конечно, но ведь ситуация тут зеркальная. Бот не может играть клавой/мышкой/монитором и человек не может через API. Так почему мы ставим в неудобные условия только бота?
                                                                                                                +1

                                                                                                                Потому что поставленная задача – ограничить бота до человеческого уровня, а не наоборот. Разумеется, это не единственный способ это сделать, и я даже не говорю, что лучший. Но это можно рассмотреть как вариант.

                                                                                                                  +1
                                                                                                                  А с какого перепуга надо ограничивать бота? У нас боты топовых европейских прогеймеров вперёд ногами выносят?
                                                                                                                  Недавно у Алекса на канале вышло видео, где игрок алмазной лиги порвал двух ботов, так никто не вопил, что матч был не честным, давайте игрока ограничивать.
                                                                                                                  Стоило боту (пятерым ботам) победить двух прогеймеров(!), как началось.
                                                                                                                  Ещё раз — ситуация зеркальная. Если мы ограничиваем бота, то тем самым признаём, что бот в реалтайм стратегию без шансов обыгрывает человека.
                                                                                                                    0

                                                                                                                    Об этом в посте тоже есть. Смысл не в том, чтобы сделать бота, который будет выигрывать у человека, а в том, чтобы сделать бота, который будет выигрывать у человека при равных возможностях по управлению юнитами. Иначе бот сможет побеждать за счёт микроменеджмента, не особо заботясь о стратегии, а нужно не это.
                                                                                                                    У AlphaStar были ограничения на число действий, но недостаточные.
                                                                                                                    А если убрать все ограничения, то да, боты легко переиграют человека. Гляньте видео в посте, где земли выносят танки при абсолютном контроле ИИ. Люди не могут пройти это испытание (уничтожить все танки), насколько я знаю. ИИ может, и с минимальными потерями.

                                                                                                                      0

                                                                                                                      *недостаточные с точки зрения автора статьи (извините, не соображу, как редактировать комментарий из мобильной версии)

                                                                                                                        0
                                                                                                                        В том то и дело, что не сможет побеждать, в старкрафт не сможет. Т.е. до этого момента таких случаев не было, а ботов делают давно, ещё с первой игры.
                                                                                                                        В старкрафте три вида деятельности — экономика, макро и микро. Чтобы победить нужно превосходить хотя бы в двух. Раньше боты показывали АПМ и 10к и 20 и даже 100к, но победить это им не помогало от слова совсем.
                                                                                                                        AlphStar, вероятно, первый бот, который умно контролит. Но этого мало, он ещё и умно развивает экономику. Вот два крыла, позволяющие птице полететь.
                                                                                                                        Пляски вокруг АПМ идут давно и не в разрезе ботов, а вообще как мерило скила. Аля «хочешь в более высокую лигу — учись кликать». Может для человека, который знает механику, понимает действия противника, знает как реагировать это полезный совет, но не надо доводить это до абсолюта. Мой АПМ (или даже еАПМ) выше твоего — у тебя нет шансов. Есть известные прогеймеры с низким АПМ, выезжающие за счёт экономики и макро.
                                                                                                                          0
                                                                                                                          У меня есть ощущение, что тут ещё несколько лет будет феномен «настоящего шотландца».

                                                                                                                          Потому что у меня есть 99% уверенность, что если бы AlpaStar сильнее зарезали бы клики — он бы забил на микро и научился бы выигрывать чисто за счёт экономики и макро.

                                                                                                                          И все статьи были тоже «разгромными»: «ну что это за игра, это вообще не Старкрафт, а Цивилизация какая-то».

                                                                                                                          P.S. Это, кстати, показывает ущербность теста Тьюринга: когда появится ИИ, который сможет долгие годы выдавать себя за человека… это будет значить, что всё — человек уже живёт исключительно за счёт милости этого ИИ. Потому что он должен будет не просто быть лучше, сильно лучше, человека во всём, но понимать чего человек может, а чего не может — причём настолько хорошо, что сможет себя ограничивать — и очень-очень точно ограничивать.
                                                                                                                            0
                                                                                                                            он бы забил на микро и научился бы выигрывать чисто за счёт экономики и макро
                                                                                                                            Полностью согласен. Это НС и она всегда выбирает один путь достижения цели. Но на этом пути она становится лучшей.
                                                                                                                            Полагаю, что экономика и микро для бота просто проще.
                                                                                                                        +1
                                                                                                                        Ситуация не зеркальная.
                                                                                                                        Когда боты были слабые, то они просто были слабые, баланс игры не нарушался, вопросов к ботам не было.
                                                                                                                        Когда боты стали играть сравнимо с человеком, нарушился баланс игры, из-за более удобного API, нежели интерфейса пользователя. API отличается от интерфейса пользователя, нарушается зеркальнность.
                                                                                                                        Когда играют люди с людьми, интерфейсы одинаковые, всё зеркально.
                                                                                                                        Когда играют боты с ботами, API одинаково, всё зеркально.
                                                                                                                        Когда играют люди с ботами, появляются вопросы, из-за нарушения баланса в игре. Это касается стратегий реального времени, в пошаговых играх, в которые играли ранее проблемы такой не было. Проблема новая. Надо думать что делать.
                                                                                                                        Например, до Старкрафта, была Дюна, там каждому юниту нужно было указывать в кого стрелять, автоматического выбора цели не было. Естественно боты там были бы еще в более выигрышном положении.
                                                                                                                        Или представим себе карту Старкрафта размером на 200 стандартных баз, внимания человека просто не хватит всё контролировать.
                                                                                                                        Еще из положения можно выйти добавив скрипты управления юнитами, развивая пользовательский интерфейс, чтобы микроконтроль и стратегию на себя брал игровой движок. Например, указал юниту атаковать, и некоторое время юнит становится недоступен и действует по своему стандартному алгоритму, не обязательно эффективному, главное одинаковому у всех игроков, для создания зеркальности, одинаковых условий игры. Микроконтроль уходит на второй план, а на первое место приходит стратегия более высокого уровня. Хотя если на помощь игроку придет ИИ, то игра может выродится в игру от шахмат, до «камень, ножницы, бумага». Указал параметры развития при старте, и далее игровой движок сам всем управляет, с минимальным вмешательством игрока. Игрок анализирует игровую ситуацию, и изредка вносит коррективы в игру, меняя приоритеты.
                                                                                                                          +1
                                                                                                                          из-за более удобного API, нежели интерфейса пользователя
                                                                                                                          Вот я и предлагаю человеку перейти на более удобный интерфейс — отказаться от монитора, мышки и клавиатуры, в пользу API.
                                                                                                                          Это как личностные особенности — кому-то обутым нормально играется, а кто-то любит разуваться. Кто-то играет в очках, а у кого-то хорошее зрение. У кого-то по молодости лет хорошие рефлексы, а кому-то за 30.
                                                                                                                          Никто же не разделяет турниры и регалии по таким различиям и неравенствам.
                                                                                                                          Ваши предложения — точно сломают равенство. Кто-то хорош в микро — вы нивелируете его скил, кто-то играет в микронезависимые билды — вы упрочите его игру.
                                                                                                                          Когда боты стали играть сравнимо с человеком
                                                                                                                          Да, но не за счёт микро. Вы боретесь с несуществующей проблемой.
                                                                                                                            0
                                                                                                                            Вот я и предлагаю человеку перейти на более удобный интерфейс — отказаться от монитора, мышки и клавиатуры, в пользу API.

                                                                                                                            Так сказать, вы пойманы с поличным! Сбросьте кожаную оболочку и пройдите в изолятор для роботов!

                                                                                                                            Каким образом вы себе представляете человека, способного играть исключительно через апи? Тем более без мышки, экрана и клавиатуры. Чем будет посылать запросы и где читать ответы? ;)
                                                                                                                              +1
                                                                                                                              Каким образом вы себе представляете человека, способного играть исключительно через апи? Тем более без мышки, экрана и клавиатуры. Чем будет посылать запросы и где читать ответы? ;)
                                                                                                                              но ведь тот же самый вопрос можно задать и про мышку для робота
                                                                                                                                0
                                                                                                                                Отнюдь. Оно было бы так, если бы роботы были отдельным «биологическим» видом. Однако, роботов создаём мы, конструируем мы и мы выбираем интерфейсы, через которые они будут работать.
                                                                                                                                Таким образом, если мы себе поставим цель «научить бота играть мышкой и экран», то и реализовывать тоже нам её, а не роботам.
                                                                                                                                0
                                                                                                                                > Каким образом вы себе представляете человека, способного играть исключительно через апи?

                                                                                                                                Ну технически если посмотреть на sc2 bot api, то там игра по сути пошаговая. каждый ход игры боту отгружается вся информация про все что он видит (все юниты/здания вне тумана войны + некоторые под туманом + вся инфа про все видимые юниты/здания), бот делает несколько действий (а-ля юнит такой-то — двигайся туда, юнит такой-то — используй абилку «атака» на таком-то юните) и говорит «закончить ход». Просто чтобы это было в real-time'е — бот должен заканчивать свой ход достаточно быстро. Технически можно сделать ботов, которые играют медленнее реал-тайма и заставить их друг с другом играть. Можно сделать так же и для ходов человека — пусть человек играет через bot api, без ограничений на продолжительность хода, со всей информацией которую предоставляли боту.
                                                                                                                                  0
                                                                                                                                  Мысль любопытна, но можно представить, сколько времени у человека займёт одна игра :).
                                                                                                                                    0

                                                                                                                                    Можно просто дать возможность менять скорость игры от быстрой к медленной и вплоть до ставить на паузу и отдавать команды а потом продолжать.

                                                                                                                                    0
                                                                                                                                    Единственное, для такого нужно будет изменить механику игры, чтобы после каждого «хода» она замораживалась, поскольку нам не нужно, чтобы за время одного «человеческого» хода все кд прошли, ресурсов набежало в пару тысяч, а все юниты достроились. ж)

                                                                                                                                    Но в целом, в пошаговую игру без ограничения по времени, действительно, без проблем можно играть и без мышки, экрана и клавиатуры, только через bot-api. А команды, в конце-то концов, можно и голосовым вводом отправлять, а пришедший ответ записывать на диктофон и затем в тетрадь переписывать.

                                                                                                                                    Но, хороший вопрос, сколько времени займёт одна игра? Год? Два? Пару поколений? :D
                                                                                                                                –1
                                                                                                                                Пускай учат играть ИИ в Majesty. Там вообще нет контроля над юнитами. Только их создание и назначение награды за врагов и разведку. Вот где стратегия.
                                                                                                                            +2
                                                                                                                            Потому что игра StarCraft — для людей, а не для ботов, а для ботов это получится уже не StarCraft. Это нечто, как минимум, без правил. В чём боты оказываются лучше. А уборщик дядя Лян, который закоротит силовой кабель — лучше всех, побеждает вообще всех.

                                                                                                                            Чего-то тут половину народу переклинило в спортивный аспект. Киберспорт — конечно, спорт, но только игровые его виды. Что это значит? Что интересны не сами по себе показатели, а сопоставление их с человеческими возможностями и ограничениями! Точнее, преодоление ограничений людьми-участниками. ПРАВИЛА ИГРЫ придуманы в основном, чтобы выпячивать именно эти ограничения. Если для старкрафта не надо будет «учиться кликать» «почти как бот», то это тоже будет уже не старкрафт.

                                                                                                                            Ну или так же шашиста «побеждает» игрок «в чапаева». Тоже можно сказать, что у того просто навыки лучше. Или робота выпустить на реальное футбольное поле (не вратарём), только сказать, что раз у этой модели ног нет, а только колёсики, то вот этому «игроку» разрешаем мяч хватать руками (манипуляторами).

                                                                                                                            Об интеллекте, стратегическом «мышлении» и технике «игры» машин это не говорит никак; вероятно, микроконтроль — это всего один аспект «нечестной игры», самый наглядный. Если даже разработчикам бота удастся снять эту претензию к упору на тактику боя вместо экономики и развития, вероятно, найдутся и другие.
                                                                                                                              0
                                                                                                                              > Бот не может играть клавой/мышкой/монитором
                                                                                                                              Не вижу проблемы. Дырка usb, дырка d-port, спеки чёто стоят но не космически.
                                                                                                                        –1
                                                                                                                        На мой если бы у AlphStar была бы проблема со спам-кликами ее бы элементарно решили. Просто бы выделили клики в одну точку и заменили бы их одним кликом и в обучающих играх
                                                                                                                          0
                                                                                                                          Это стало возможным благодаря трюку под названием «быстрый огонь». TLO не щёлкает супербыстро. Он просто держит кнопку — и игра регистрирует это как 2000 APM. Единственное, что вы можете сделать с быстрым огнём — это спамить с сумасшедшей скоростью. Вот и всё. TLO просто использует это по какой-то причине.

                                                                                                                          Протосы его используют для одной простой цели — быстро призывать юнитов. Без этого приема необходимо сначала выбрать юнита, которого хочешь призвать, а после этого кликнуть мышкой в нужном месте. А вот с помощью «быстрого огня» клики мышки совсем не нужны — первое нажатие клавиши выбирает юнита, а второе нажатие клавиши призывает его в место, куда указывает курсор мыши. Таким образом, достаточно зажать одну кнопку, и провести курсором мыши, чтобы призвать сразу большой отряд.
                                                                                                                            +1
                                                                                                                            Сам по себе он не мог дать такое распределение как на графике: ну не мог же TLO пол-игры юнитов варпать. Там явно он использовался для чего-то ещё.
                                                                                                                              –1
                                                                                                                              Rapid Fire работает не только с призывом юнитов, есть другие способности с «быстрым» прменением, например snipe у призраков за терранов: youtu.be/4k3CXRRrHbM?t=21
                                                                                                                            +2
                                                                                                                            Проблема в том, что StarCraft слишком сложен для того, чтобы решить эту задачу «в один прием». Даже если ты — DeepMind, у тебя есть Google TPU и все деньги мира.

                                                                                                                            Когда эти господа делали ИИ, который играл в Atari, если мне не изменяет память, они дали ИИ в качестве «устройства ввода» имитацию джойстика, а в качества «устройства вывода» просто картинку н экране. Сеть училась набивать максимальный счет — единственная доп информация, которую она получала (и это — разумное допущение, так как обучение чтению и интерпритации чисел, написаных на экране — вне пределов поставленной задачи).

                                                                                                                            Вполне понятно, почему Object Detection не использовался для SC2. Смысла тратить силы на обнаружение юнитов на экране не особо много. Это не влияет на результат.

                                                                                                                            А вот со вводом они явно напортачили. Сетка умеет выполнить команду «выделить юниты» или «отправить на атаке туда-то». До кучи, она видит всю огромную карту, вместо одного экрана. Фактически, если проводить аналогию с человеком, она «чувствует, как меняется состояние каждого юнита на карте и отдает приказы силой мысли». Думаю, что имея такие сверхспособности, многие из нас смогли бы обыграть прогеймера с мышкой и клавиатурой…

                                                                                                                            Решение тут очень простое. Выдать сетке ту самую мышку и ту самую клавиатуру. И задать лимиты, с которыми она может тыкать в кнопки и двигать курсором. Бог с ней, с точностью. Лишь бы скорость была «человеческой».

                                                                                                                            Да, уить ее пользоваться мышью и хоткеями было бы несколько дольше и сложнее. Но этим мы автоматически снимаем проблему спам-кликов. Люди спам-кликают рядом с тем местом, где кликнули только что. Сделать пять «спам-кликов» подряд по разным юнитам на разных частях карты не удастся.
                                                                                                                              +8
                                                                                                                              Немного сарказма. Претензии к ИИ по поводу "чувствует, как меняется состояние каждого юнита на карте и отдает приказы силой мысли" — очень похожи на жалобы терранов, что королева Роя чувствует всех своих подопечных и отдаёт им приказы телепатически, т.е. их система коммуникаций превосходит таковую у людей, и «это нечестно». =)
                                                                                                                                0
                                                                                                                                Это же не претензии. Просто я попытался в первом приближении создать модель задачи для ИИ, приближенную к той, которую решает реальный игрок. Там некоторые комментаторы уже написали про «добавить ему определенный процент мисскликов и уменьшить память!!» Вот это я считаю уже перебором.
                                                                                                                                  0
                                                                                                                                  По аналогии несколько человек бы за одну комманду играли бы тогда — прикольно было бы посмотреть. Один человек отвечает за стратегию (где строим базу и когда атакуем) и еще трое человек(напритер) микрят отрядами юнитов.
                                                                                                                                  Иерархия управления как в человеческой армии.
                                                                                                                                    0

                                                                                                                                    В режиме архона так и играют, только не несколько человек, а двое...

                                                                                                                                    0

                                                                                                                                    Зато у людей каждый юнит думать умеет… Самые читеры в этом плане — протоссы, у них есть (ну, был до событий кампании LotV) и индивидуальный интеллект, и телепатическая связь друг с другом.

                                                                                                                                      0
                                                                                                                                      А какие приумущества теоретически дает телепатия по сравнению с высококачественной телекоммуникацией людей?
                                                                                                                                        0
                                                                                                                                        Любая группа (светлых) протоссов без всякой подготовки становится сработанным отрядом.
                                                                                                                                    –2
                                                                                                                                    А вот со вводом они явно напортачили. Сетка умеет выполнить команду «выделить юниты» или «отправить на атаке туда-то».

                                                                                                                                    Вы критикуете, не разбираясь в вопросе. Сетка не умеет выделять юнитов. Сетка использует API, который Близард написали для работы ботов. Какой интерфейс сделали для ботов — таким бот и пользуется. Так вы придёте к проведению матчей бот и человек играют мышкой, и бот и человек играют через API. Ну чтобы все были «в равных условиях».
                                                                                                                                      0
                                                                                                                                      Сетка не умеет выделять юнитов. Сетка использует API, который Близард написали для работы ботов.

                                                                                                                                      Лол. Я не только знаю об этом, я сам скачивал pysc2 и изучал его API, пытаясь что-то тогда даже изучать и кодить. Жаль, знания на тот мемент подвели. Я только начинал изучать tensorflow. А еще я несколько лет назад что-то делал на BWAPI. Правда, увы, тоже безуспешно.

                                                                                                                                      Под «умеет выполнить команду «выделить юниты»» я имел в виду как раз API команду. Человек же такой опции не имеет. Ему надо либо Ctrl+Click+Click+Click, либо «резинку», которая выделяет рамкой и совсем не мгновенно.
                                                                                                                                    +8
                                                                                                                                    Это все не то, ни го, ни шахматы, ни победы в 1х1 в доте, ни в старкратфте. То есть это, конечно же, сильный шаг вперед, но все равно — не это ожидается от ИИ. Игры, в которых можно выиграть благодаря чудесному микроконтролю или особо далеким просчетам туч комбинаций — это все естественно рано или поздно падет перед компами. ИИ интересен именно с точки зрения стратегического мышления в условиях недостатка данных — и я не очень понимаю, почему как раз эту интересную тему вечно обходят и пытаются выехать на микроконтроле. Да кому нужны ваши клики в нужный пиксель вообще, очевидно что компьютер это делает лучше, чем человек и быстрее! Интересно как бы повела себя стратегия в условиях недостатка микро, как она смогла бы переигрывать на макро уровне — вот что важно, а не эти тыки. А для этого нужно во-первых ограничение сверху на апм, во-вторых игра, в которой макро влияет на результат существенно больше, чем микроконтроль (например, LoL, только не урезанный «1х1 на миде», а полноценный 5х5 и со всеми героями).
                                                                                                                                      +2
                                                                                                                                      Старкрафт не требователен к микроконтролю. В игре три кита, в двух из которых надо быть лучше соперника для победы. Это экономика, макро и микро. Эта победа показала, что у бота может быть что-то ещё, кроме хорошего микро. Да и микро мягко говоря было несравнимо лучше других SC2 ботов, что тоже огромное достижение или даже прорыв на новый уровень.
                                                                                                                                        +1
                                                                                                                                        В игре три кита, в двух из которых надо быть лучше соперника для победы.

                                                                                                                                        Мне кажется тут дело все таки не в «быть лучше в двух», а суммарно за все категории набрать больше баллов. Т.е. можно проигрывать и в макро и в экономике, но если микро на нереальном уровне, то все равно можно одержать победу
                                                                                                                                        +2
                                                                                                                                        Это все не то, ни

                                                                                                                                        Настоящий ИИ как настоящий социализм. Все время не то. Я помню, как читал книжечку 60-ых годов, где рассказывалось, что компьютер никогда не выйграет людей в шахматы ведь там надо перебирать так много комбинаций…
                                                                                                                                        или особо далеким просчетам туч комбинаций

                                                                                                                                        И статьи совсем недавних лет, где объяснялось почему го неподвластны компьютерам.
                                                                                                                                        и я не очень понимаю, почему как раз эту интересную тему вечно обходят и пытаются выехать

                                                                                                                                        Именно этой темой и занимаются ДипМайнд или ОупенАи.
                                                                                                                                          +1
                                                                                                                                          или особо далеким просчетам туч комбинаций


                                                                                                                                          Шахматы и Го были выбраны как раз из-за того, что просчет тучи комбинаций там практически невозможен. Построение полного дерева на текущем этапе развития техники невозможно. И по сути Альфа играет в эти игры именно как человек — базируясь на текущем опыте и прикидывая сравнительно недалеко…

                                                                                                                                          ИИ интересен именно с точки зрения стратегического мышления в условиях недостатка данных
                                                                                                                                          — именно поэтому Старкрафт. Ну, по крайней мере должен быть. Потому, что планировалось, что всю карту он не будет видеть, как и человек.

                                                                                                                                          Я думаю, что высокий АПМ — это временный этап. Им нужно было что-то показать, и если бы они показывали бота, проигрывающего, это не вызвало бы резонанса.
                                                                                                                                            0
                                                                                                                                            А вот про шахматы — это вы, как раз, зря.

                                                                                                                                            Если посмотрите ролики со знающими людьми, все сходятся на том, что Fritz, которого на голову разнес AlphaZero, как раз, играл на «глубоком просчете», а сам AlphaZero делал нестандартные ходы и очень элегантные комбинации, которые «железке, мыслящей в лоб» в голову не придут.

                                                                                                                                            Но шахматы намного проще, чем СК…
                                                                                                                                              0
                                                                                                                                              Majesty.
                                                                                                                                              0
                                                                                                                                              Что-то не понимаю в статье. С одной стороны, утверждается, что для AlphaStar подняли APM, потому что среди нажатий много спам-кликов. С другой стороны, педалируется мысль, что с 500 APM и без спам-кликов бот легко победит человека. Так были спам-клики или нет?
                                                                                                                                                +2
                                                                                                                                                Сначала подняли лимит по APM из-за спам-кликов. Потом бот отучился делать так много спам-кликов, а лимит APM остался.
                                                                                                                                                  +4
                                                                                                                                                  Спам клики были. Автор статьи вообще не разбирается в ботах и старкрафте про уровня (не знает что таое рапид фаир и для чего его все используют), выдаёт желаемое за действительное (приравнивает АПМ бота к ЕПМ без доказательст этого).
                                                                                                                                                  И вообще пишет про «точность кликов» в игре с неполной информацией. Это можно вообще перевести, как «Мана проиграл 5:0 (с ТЛО вместе) по причине неточных кликов», что феерическая чушь.
                                                                                                                                                0

                                                                                                                                                По поводу спам-кликов и высокого APM в целом: обычно же делают, что каждое действие агента(которое не дает reward) уменьшает reward, из-за чего агент учится делать всё наиболее рационально. Интересно использовалось ли это в AlphaStar?
                                                                                                                                                Мне кажется, тогда мы бы видели средний APM в районе 100, просто потому что в "ответственные" моменты он бы выдавал >2000 apm.

                                                                                                                                                  +1
                                                                                                                                                  Мне кажется суть AlphaStar не в том как быстро он может управлять юнитами или быстро кликать, а в том что он сумел адаптироваться к игре и создать план, следуя которому он может победить.
                                                                                                                                                    +5

                                                                                                                                                    В том то и дело что он не смог адаптироваться, что наглядно показано в последней игре)

                                                                                                                                                      0
                                                                                                                                                      Ну он вроде в минералы потом фотонки поставил.Оракулом подсветил и… и потом уже его окончательно заглючило. Кстати некоторые люди так же тупят, особенно те которые не в гмл лиге.
                                                                                                                                                        –1
                                                                                                                                                        В последней игре Мана проиграл и это был счёт 5:0. Следующая игра была отдельно, с недоученным ботом, которому прикрутили ненужный костыль.
                                                                                                                                                      +3
                                                                                                                                                      А я вот на фоне всплеска ИИ позволю себе обратить внимание на людей. Все удивляются как смогла машина выиграть у людей. Но посмотрите на удивительные результаты самих людей! На какую безумную высоту могут подняться отдельные личности в отдельных дисциплинах.

                                                                                                                                                      Как доминирует Магнус Карлсен в блице, что последнюю партию в классику на последних двух своих чемпионских матчах в классику просто сводит быстренько в ничью в уверенности что просто размажет соперника в блиц.

                                                                                                                                                      На что способны чемпионы по старкрафту, го, Усейн Болт в беге в конце-концов! Просто удивительно на что способно сочетание факторов генетики, тренировки и сумасшедшей мотивации и упорства на протяжении десятилетий
                                                                                                                                                        +2

                                                                                                                                                        Ещё один довод к статье, графики распределения APM вводят в заблуждение, потому что людям нужно раскликиваться.


                                                                                                                                                        Прогеймеры все кликают примерно как MaNa, посмотрите внимательно: нет моментов с 1500 APM, но и почти нет моментов с < 100 APM. Хотя в начале игры и многих других ситуациях совершенно нефиг делать с высоким APM. Прогеймеры спамят клики в спокойных ситуациях только для того, чтобы в начале решающего сражения руки были готовы к высокой скорости.
                                                                                                                                                        Поэтому средний APM у бота ниже, ему это нафиг не нужно.


                                                                                                                                                        Судя по ситуации с AlphaGo Zero, ребята из Deepmind должны