Как стать автором
Обновить

Комментарии 182

Интересно, когда же, наконец, разработчики игр возьмут на вооружение разработки в области Deep Learning для создания «человечных» NPC и интересных диалогов… Это будет новая эра в игростроении.

А пока хоть бы Близы добавили нормальный ИИ в игру. Так ведь не станут — это ж снизит посещаемость Battle.Net…
Если вы думаете что целью у этих ИИ будет сделать игру интереснее, то скорее всего ошибаетесь. Главной целью, которую поставят ИИ будет — нужно больше золота. И вместо интересной игры геймерам будут давить на центры удовольствия и теребить животные инстинкты.

Т.е. идеальной игрой, которую сделает ИИ, станет этакий экран с абстрактной анимационной картинкой, гипнотизирующей человека и заставляющего его вываливать все деньги из своих карманов.
Хех, вот вы поболтаете с НПЦ, а ваша беседа уйдет корпорации. Это же бесценные данные, особенно в совокупности по многим людям.
Уже давно всё, что вы обсуждаете с вашими друзьями и родственниками в соцсетях, уходит корпорациям. И?

Мирового коллапса это пока не вызвало.

Мне кажется, утечка информации в играх — последнее, чего следует опасаться в связи с развитием искусственного интеллекта.
А я не о коллапсе. Я о деньгах.
Позвольте уточнить. Как я понимаю, Макс имеет в виду обучение алгоритма поведения НПС на основе переданных данных от всех игроков в диалогах. Это обратная связь очень интересна, но пока довольно непредсказуема и сложна.
Возможно. Я, лично, вообще не думаю об ММО. Я их не люблю :) Предпочитаю сингл плеер. Поэтому и не сообразил сразу.
Нет, я представлял себе что-то вроде данных об интересах пользователей. На основе которых можно, скажем, таргетировать рекламу, прогнозировать спрос и т.п.
Персональный шпион-НПЦ в любимой игре, которому ты наивно доверишь свои самые интимные секреты — вот о чем я подумал. Сейчас такое возможно лишь на самом примитивном уровне, а с ИИ-НПЦ можно попытаться вытянуть из юзера нужную информацию путем индивидуального подхода.
НЛО прилетело и опубликовало эту надпись здесь
но что-то пошло не так…

Это смотря с какой точки зрения посмотреть. С некоторых все наоборот пошло очень даже так.

Прочитал на одном дыхании, хоть я и не являюсь фанатом пони, отличный рассказ.
А вот это суровая правда, сейчас ИИ используется для того что бы получше впаривать людям не нужное им говно вместо того что бы кинуть все силы на разработку против серьезных болезней.
того что бы кинуть все силы на разработку против серьезных болезней.
Кто такое сказал? Сейчас есть разработки в этом направлении. Так ИИ лучше ставит диагнозы, чем врачи. У бота множество данных о симптомах, их скармливают машине, а она просто мимикрирует и выдает результаты.
А вот это суровая правда, сейчас ИИ используется для того что бы получше впаривать людям не нужное им говно
Вот почему сразу ненужное? Вполне себе нужное.
Ну да. Если впаривание успешно удалось — значит с точки зрения обработанного оно теперь нужное.
Ненужное говно ИИ сейчас не особо умеет впаривать. ИИ только помогает лучше совместить набор товаров с группами людей, которые эти товары хотели бы купить. За создание спроса пока отвечает не ИИ.
с другой стороны врага увидим в лицо
Тут недавно играл в свиду примитивную игрушку кликер, где играешь от лица управляющего ИИ. Там одна из последних технологий которые нужно освоить
Сюжетный спойлер концовки 1й части - для незнакомых с концепцией <оптимизатора скрепок> лучше не читать, а поиграть в игру сначала
разработка метода «взлома» психики людей (на основе предыдущих разработок по эффективному нейро-маркетингу, проведенных для стимуляции продаж выпускаемой продукции) и массовое производство гипно-дронов под видом рекламных ботов

После чего уже можно спокойно начинать разбирать планету, чтобы получить ресурсы необходимые для производства 6 октиллионов скрепок — люди больше мешать не будут. Собственно люди тоже на скрепки пойдут.
НЛО прилетело и опубликовало эту надпись здесь
А кто сказал, что оно должно быть умнее человека?
Вы можете обучить его быть глупым, средним… Лишь бы при этом оно выглядело человечно. Неписи в современных игрушках раздражают не глупостью, а механичностью, неестественностью. Они выглядят тупой неживой декорацией. И геймдизайнерам приходится идти на сотню ограничений и уловок, чтобы это было как можно менее заметно. И всё равно не помогает.

Лично меня в этой демонстрации СтарКрафта больше всего впечатлило не то, что нейросеть размазала противников почти всухую (этого следовало ожидать рано или поздно), а то, что она легко и изящно проходит тест Тьюринга.

Самое революционное в этой сетке то, что она побеждает сильных игроков, при этом имея более низкий средний APM. А еще то, что она попутно решает задачи в духе «как двигать камерой, чтобы видеть самое интересное».
А кто сказал, что оно должно быть умнее человека?
Вы можете обучить его быть глупым, средним…

Ага, для реалистичных NPC надо не просто создать сильный ИИ, но еще и заставить его отыгрывать роль! Чтобы он тактично уходил от каверзных вопросов игрока, придерживаясь механики игровой вселенной. А это уже не просто сильный ИИ, а очень сильный! Не каждый профессиональный GM так может.
Ну зачем же такой максимализм-то? Или механическая игрушка: или сразу GM…

Давайте, для начала, представим себе, что NPC разговаривает в разных «интонациях» и чуть разными словами, в зависимости от его настроения и вашей силы/поведения. Просто, смоделировать нормальную особенность человека — по-разному реагировать на разных собеседников.

Уже будет какая-никакая жизнь.

А выбор ваших реплик в диалоге еще очень долго придется делать из списка — тут да, непросто.
Лично меня в этой демонстрации СтарКрафта больше всего впечатлило не то, что нейросеть размазала противников почти всухую (этого следовало ожидать рано или поздно), а то, что она легко и изящно проходит тест Тьюринга.

Самое революционное в этой сетке то, что она побеждает сильных игроков, при этом имея более низкий средний APM.
Это в каком таком месте она тест Тьюринга проходит? В том самом, в котором ее более низкий средний апм становится супервысоким текущим апмом, и сетка за счет микроконтроля уровня СУПЕРБОТ9000 разбирает куда более сильную армию противника? Да и продула она именно в тот единственный раз, когда перед ней поставили задачу двигать камерой.

Ну стоит уточнить, что продул агент с камерой который учился 5 дней всего, другие же агенты без камеры учились по 200 лет каждый, а таких агентов было более 1000 и вот с ними уже было 0 шансов у человека. Я как любитель в старкрафт могу сказать, что тест Тюринга ИИ проходит он действует как человек но при этом почти не совершает ошибок. Самые значительные отклонения от человека заключаются в начальной разведке, да и в разведке в целом и видно, что разведка дроном это некий рудимент обучения на людях, бот пытается повторить эти действия но не до конца и не понимает зачем ему это.

А вы чуть-чуть понизьте планку.

Если не требовать от бота, чтобы он побеждал чемпионов, а просто понизить ему пиковый APM до человеческого, скажем, 300. Я вам ручаюсь как многолетний житель серебряно-золотой лиги СК2 — если этого бота пустить туда и научить его в конце партии вежливо говорить «gg», даже опытный игрок не отличит его от человека.
Ну сомнительный аргумент. В бронзе и обычный аи из Старкрафта тест Тьюринга пройдет :)
Не пройдет. Он играет топорно и всегда одинаково. Не делает никаких нестандартных решений. Он никогда вас не попытается зафотонить. Его разведку можно предсказать с точностью до секунды и так далее.

Сыграйте с ним 10 игр и вы будете побеждать даже с APM 30. А вот реальных игроков с тем же APM — даже в бронзе — победить куда труднее.

Стандартный бот выигрывает, потому что у него есть мапхак. Ему невозможно устроить «surprise attack». В этом его единственное и ключевое преимущество.

И, кстати, пиковый APM (вернее, конечно, EPM) в 300 — это далекоо не «бронза».
А вы посмотрите на график прежде чем писать: habrastorage.org/getpro/habr/post_images/4e1/5f0/c59/4e15f0c59dd1daff2f477a1bc7733f86.png

На нем не только средний APM но и мгновенный и распределение по времени. Так вот — мгновенный, тоже не превышает человеческого уровня.
Этот график — немножко профанация, обсуждалось уже. Человек кликает дуром, а машина делает только (или почти только) полезные действия.
На нем не только средний APM но и мгновенный и распределение по времени. Так вот — мгновенный, тоже не превышает человеческого уровня.

Мгновенный апм TLO — это рапид фаер, то есть зажимается одна кнопка и набивается апм нонстопом (с-но, сами то не могли догадаться, что 2к апма для человека — физически невозможное значение?). Игнорируйте его график и сравнивайте хвосты с маной — там все сразу понятно, даже без учета того, что процент "бесполезных кликов" у маны, опять таки, сильно выше чем у альфы.

Вы можете обучить его быть глупым, средним… Лишь бы при этом оно выглядело человечно

Скорее всего, будут оптимизировать под целевые поведенческие паттерны игрока. Условно, не «победил» -> плюс в карму, а
«игрок играл еще более часа после конкретной битвы» -> плюс,
«игрок выключил комп после битвы» -> «минус»,
«игрок задонатил после битвы» -> «100 плюсов»,
«игрок удалил акк после битвы» -> «100 минусов».
Но, разумеется, куда более аккуратнее, и с более микроструктурными метриками
НЛО прилетело и опубликовало эту надпись здесь
А вы сами пробовали создать ИИ, который бы проходил тест Тьюринга? Хотя бы в простых игровых правилах
НЛО прилетело и опубликовало эту надпись здесь
Ну так и круто! Для меня — тоже. Вот я ими и восторгаюсь ;)
она легко и изящно проходит тест Тьюринга.
при этом имея более низкий средний APM

APM — APM-ом, а точность кликов и скорость реакции совершенно нечеловеческие. И в 10 первых ихрах бот видел всю карту сразу (хоть и с туманом войны) и камеру никуда не двигал. Разработчкики, конечно, говорили, что, мол, он внимание фокусировал вроде как в одном месте, но там был момент, где бот контролировал одновременно 3 группы юнитов с разных сторон, когда окружал армию противника.


В последней игре, вроде как, ввели понятие камеры для бота и он ее проиграл.

Тут вопрос как учили. Если обучение шло в 1м варианте (с туманом войны, но без ограничения поля экрана), что скорее всего. То такое резкое изменение условий игры на ходу без тренировки/адаптации ИИ просто никаких шансов на победу не оставляло.

Интересно посмотреть на игру ИИ который изначально с подобными ограничениями учился играть.
Интересно посмотреть на игру ИИ который изначально с подобными ограничениями учился играть.

Та сеть, что играла с ограничением по экрану, с этим ограничением и тренировалась. Это была отдельная сеть.

Ну мне кажется можно не делать харкор, а добавить вариативности — в поведении, характере NPC, возможности или настроении дать какое-то задание.

UPD: bigfatbrowncat опередил и дал более развернутый ответ ))
Вы играли в что то киберспортивное? это самая настоящая работа которая изматывает мозг за 3-5 часов. Та же дота и старкрафт.
3-5 часов — да вы оптимист.
И если от них там будет требоваться работа — большинство просто перестанет играть. «Долбанутые» геймеры останутся, конечно, но кассу они не делают.
Это всё равно что говорить о профессиональном спорте. Чемпионы мире — еще те… «долбанутые».
НЛО прилетело и опубликовало эту надпись здесь
А человек настолько легко это делает, что ему кажется, что этот процесс настолько прост, что его можно вообще не реализовывать в ИИ, что абсолютно неверно
В каком возрасте человек делает это легко? Нужны годы, чтобы научить говорить, а потом еще и понимать. Да, пока ИИ не может. Но, закликать человека — легко…
НЛО прилетело и опубликовало эту надпись здесь

Как раз такого рода задачи ИИ уже относительно хорошо решает. См. например датасет bAbI. Там как раз такого рода примеры:


1 Mary moved to the bathroom.
2 John went to the hallway.
3 Where is Mary? bathroom


И более сложные запутанные ситуации. Но в целом верно, существующие системы обучения ИИ оторваны от реального мира и нет никаких гарантий, что из предоставляемых им датасетов можно извлечь эту информацию. О том что на самом деле происходит в описываемом тексте. Не говоря о практически отсутствующей у текущих слабых ИИ возможности делать последовательные рассуждения.

НЛО прилетело и опубликовало эту надпись здесь
Это потому что в bAbI вопросы специально разбиты на категории по отдельным задачам. Вот смотрите, задача по выявлению временных зависимостей (Taks 14):

После обеда Юлия пошла в парк.
Вчера Юлия была в школе.
Юлия ходила в кино этим вечером.
Q: Куда Юлия пошла после парка? A: В кино.
Q: Где Юлия была перед парком? A: В школе.

Предложения специально перепутаны местами. Про сегодняшний день первое и третье предложение, а второе про вчерашний. Причем в первом предложении ничего не говорится о том, в какой день после обеда это произошло. Нужно из общего контекста понять, что речь идет о сегодняшнем дне.

Это довольно близко к вашему примеру, не так ли? Из него тоже нужно выделить временную последовательность событий, что и в каком порядке происходило. Хотя предложения в тексте вашего примера тоже идут не в хронологическом порядке, как и в Task 14. Вот в какой последовательности у Кати прошел день:

1. Катя долго собиралась.
2. Катя опоздала.
3. Катя обнаружила, что торт съеден.

Приведенные вами вопросы — это вопросы по контексту. Просто чуть более сложный вариант, но принципиально такой же, как восстанавливать из контекста, что первое и третье предложение в примере из Task 14 касаются сегодняшнего дня.

Ну и не надо забывать, что bAbI это игрушечный сборник задач. Один из первых такого рода.
НЛО прилетело и опубликовало эту надпись здесь
А ИИ этого не делает, ИИ лишь выдаёт результат, который по сути функция от вводных данных.


Строго говоря, «вообразить» что-то – это тоже функция от входных данных. Это просто промежуточное представление. А именно благодаря «промежуточным» слоям нейросети последнее время так хорошо работают. То, что называется Deep Learning, это и есть «вообразить», как вы называется.

Более конкретный пример: автоэнкодер. У него в середине слой очень маленького «разрешения», поэтому нейросети «приходится» при тренировке придумать очень скомпрессированное представление того, что ей подали на вход.

Схема:
image

Отсюда же картинки про «сумму» очков и лица:

image

Есть некое промежуточное представление того, что такое «очки», и как их «надевать» на лицо.

Почему это не «воображение»?

Строго говоря, «вообразить» что-то – это тоже функция от входных данных.

Нет. Если вы слышите, как кошка лазит за шкафом, у вас в воображении появляется и кошка и шкаф и примерное расположение кошки. А входные данные это шум. А в другой ситуации, например в гостях у друга, у которого собака, или если у вас нет кошки, такой же шум даст другую картинку в воображении.


То есть это функция не только от входных данных, а еще и от предыдущих запомненных. Их тоже можно считать входными, но вопрос в том, как они появляются в воображении из входных данных на тот момент.

Это искусственные нейросети тоже довольно давно умеют. Только не самые простейшие сверточные, а с внутренней памятью и обратными/циклическими связями — LSTM например и другие рекуррентные сети.
У них формируются некие собственные внутренние понятия и объекты в процессе обучения, а так же память о предыдущих событиях (уже непосредственно в процессе работы) влияющая на то, как будут обработаны новые входные данные.
Например если это чат бот или преводчик текста — ответ на конкретный вопрос или перевод конкретного предложения будет существенно различаться в зависимости от того, о чем шла речь раньше (в предыдущих фразах разговора или ранее по тексту).
Вы слишком обобщаете. Дело ведь не в том, зависит ли ответ чат-бота от прежних данных, а в том, правильно ли он отвечает с их учетом. Должны быть не «некие» внутренние понятия, а вполне конкретные, соответствующие внешним, причем каждое отдельно от остальных. Чтобы переводчик мог представить то что написано текстом, и описать эту ситуацию на другом языке, включая предлоги и взаимодействия. Такого нейросети пока не умеют.
НЛО прилетело и опубликовало эту надпись здесь
Когда подросток читает «Таинственный возраст» он создаёт мир, в котором есть всё, что описано в книге по тексту книги.

Когда нейросеть «читает» этот же текст, то она ничего подобного не делает.

Неверное утверждение. Нейросеть как раз делает то, что и подросток — создает, воображает модель мира. Другое дело, что ни одну нейросеть пока не обучали на таком же объеме данных, как получает за жизнь подросток.

Пруф. По одной картинке (слева) нейросеть воображает целый лабиринт, который мог бы соответствовать этой картинке. Это и есть воображение (или внутренняя модель мира в сознании), о котором вы говорите.

image
Неверное утверждение. Нейросеть как раз делает то, что и подросток — создает, воображает модель мира.

Нейросеть решает конкретную задачу, на которую вы ее обучите. Это совсем другое.

Человеческий мозг, в конечном счете, тоже решает одну единственную задачу. Победить в эволюционной гонке. Выжить, обойти других представителей своего вида по общественно-значимым критериям, оставить жизнеспособное потомство. Всё, что мы делаем в процессе, либо служит этим целям, либо нам кажется, что служит. Большинство игр в широком смысле этого слова (в том числе и художественная литература) имеют или обучающую задачу, то есть повышают общие знания и интеллект, помогая выжить, или создают иллюзию такого обучения, которая захватывает человека, паразитируя на инстинктах.

Человеческий разум не может быть смоделирован целиком не из-за какой-то особенной сущности, а всего лишь из-за чрезвычайной сложности.

Но возможность смоделировать его поведение в рамках решения отдельной задачи (а задачи эти всё продвинутее и все более творческие по своей сути) уже убедительно доказана.
Человеческий мозг, в конечном счете, тоже решает одну единственную задачу. Победить в эволюционной гонке.

Вообще-то нет. Не решает он такой задачи.

Если не решает, то человек не оставляет потомства. Или его потомство голодает/живет под мостом/умирают от болезней (вставьте свой вариант).

Эволюцию среди людей никто не отменял. Она видоизменилась — правила игры стали сложнее, чем у животных. Но все элементы — борьба за лидерство, адаптация, брачные игры — всё осталось таким же. Укажите мне, пожалуйста, на любую деятельность человека, которую нельзя было бы вписать в модель эволюции.
Если не решает, то человек не оставляет потомства. Или его потомство голодает/живет под мостом/умирают от болезней (вставьте свой вариант).

Ну так на практике это весьма часто происходит, ergo, не решает.


Укажите мне, пожалуйста, на любую деятельность человека, которую нельзя было бы вписать в модель эволюции.

Натянуть сову на глобус, безусловно, можно всегда, ведь если привести пример людей, которые не ставят целью классические "жена-дети", то вы бодро отрапортуете, что это компенсация.


Но вы забываете одну простую вещь — у эволюции нет никакой цели. Эволюция (как и природа в общем) не обладает разумом и не способна к целеполаганию.
По-этому никакой задачи, вообще говоря, перед мозгом (и вообще любыми органами) не стоит. Все органы работают совершенно случайным образом, сформировавшимся исторически, в качестве казуса (те, у кого органы работали плохо, очевидно умерли). Вот и все.

если привести пример людей, которые не ставят целью классические «жена-дети», то вы бодро отрапортуете, что это компенсация...

Я не буду рапортовать, что это — компенсация. Я скорее скажу, что человека общество поставило в такие условия, в которых желание размножаться у него отсутствует. Причин может быть масса. От банального эгоцентризма до выстраданного протеста в виде нежелания рожать детей в это общество.

Кстати, есть огромное количество примеров, когда человек сознательно берет на себя ответственность, строит семью, понимая, что будет тяжело, делает детей, хотя знает, сколько с ними трудностей. И это всё — ради того, чтобы обеспечить своему роду жизнь после своей смерти. Способность потеснить своё личное эго ради чего-то большего — тоже некислый такой эволюционный плюс.

Когда вы говорите про органы, то вы учитываете только выживание отдельного организма. А он на масштабах эволюции не значит ничего. Самый здоровый, но бесплодный получает премию Дарвина уже во втором поколении.

Когда я говорю «задача», я не имею в виду, что пришел учитель и сказал «пишите Д/З». Я имею в виду, что мозг потребляет энергию, которую существо вынуждено добывать прилагая серьезные усилия. И чтобы оправдать свое существование в теле, он должен что-то производить. Мозг производит интеллектуальные усилия — с целью улучшить условия жизни как отдельной особи, так и общества в целом.
Я имею в виду, что мозг потребляет энергию, которую существо вынуждено добывать прилагая серьезные усилия. И чтобы оправдать свое существование в теле, он должен что-то производить.

Нет, он никому ничего не должен. Потому что, еще раз — у природы нет целеполагания.


Мозг производит интеллектуальные усилия — с целью улучшить условия жизни как отдельной особи, так и общества в целом.

Мозг производит интеллектуальные усилия просто потому, что он так устроен. Точно так же у Солнца нет цели вставать на востоке и заходить на западе. Просто так устроена солнечная система. Никак по-другому Солнце действовать просто не может. Как и мозг.

У нас с вами расхождение в терминах. Вы, почему-то, очень уцепились за
у природы нет целеполагания.

Ну хорошо, нет — так нет. Природа не имеет своего разума, сознания, у нее нет ни целей, ни средств, ничего. Вопрос смысла жизни сам по себе некорректен, все деяния тщетны, так как ничего не меняют.

Какой тогда смысл в нашей с вами дискуссии?

Всегда очень интересно, зачем в споре апеллировать к тщетности бытия, если этот аргумент никак не помогает выиграть спор — он только делает этот спор бессмысленным.

Я сказал «цель — выживание», потому что мне так подсказывает мой собственный инстинкт самосоханения, который, полагаю, есть и у вас. Можно, конечно, от него отказаться, но это сразу выводит нас с вами из множества разумных живых существ, потому что (я в этом убежден) без этого инстинкта полноценный разум невозможен, ибо без мотивации нет развития.
Всегда очень интересно, зачем в споре апеллировать к тщетности бытия

Чет непонятно, как вы от отсутствия целей у природы пришли к тщетности бытия.


Я сказал «цель — выживание»,

Цель чего?

>Цель чего?

Цель живого существа. Основная задача живого существа — выжить и оставить потомство. Основная цель живого существа — решить его основную задачу.

Честно говоря, у меня такое ощущение, что я не с человеком беседу веду, а с андроидом, построенном на формальных логических описаниях… Извините.

>Чет непонятно, как вы от отсутствия целей у природы пришли к тщетности бытия.

Когда вы сказали «у природы нет целеполагания», вы вывели дискуссию с уровня обсуждения смысла жизни конкретной популяции особей (о которой говорил я) на уровень смысла жизни как таковой. А этот уровень здравому смыслу неподвластен. Он уже из области веры скорее. На это я вам и указал, назвав «обсуждением тщетности бытия».
> Цель живого существа. Основная задача живого существа — выжить и оставить потомство.

И кто ему такую задачу поставил?

> Когда вы сказали «у природы нет целеполагания», вы вывели дискуссию с уровня обсуждения смысла жизни конкретной популяции особей

Так нет никакого смысла жизни конкретной популяции особей. О том и речь.

Вещи работают так, как они работают просто потому, что эти вещи так устроены. Не потому, что есть какая-то «цель» или «задача».
Это уже софистика. Понятие «результат» — это просто обозначение причинно-следственной связи. ru.wikipedia.org/wiki/%D0%A0%D0%B5%D0%B7%D1%83%D0%BB%D1%8C%D1%82%D0%B0%D1%82

Моя основная аксиома: смысл жизни состоит в сохранении жизни. Не данной конкретной особи, а жизни как таковой, как явления.

Эта аксиома дает возможность каких-либо осмысленных построений, выделения целей и результатов. Достигнутых или нет.

Выходить за рамки этой аксиомы в данной дискуссии я отказываюсь, так как мне это просто неинтересно.

Отсутствие у самой природы как таковой смыслов и целей не мешает нам ей эти смыслы придавать и цели обозначать. Просто для того, чтобы наши с вами мыслительные действия можно было вести.

А без цели мысль бесполезна. Она просто не работает.
Моя основная аксиома: смысл жизни состоит в сохранении жизни. Не данной конкретной особи, а жизни как таковой, как явления.

Ваша аксиома ложна. У жизни (как таковой, не конкретной особи) нет никакой цели. Потому что у жизни нету сознания. А без сознания цели быть не может.


Отсутствие у самой природы как таковой смыслов и целей не мешает нам ей эти смыслы придавать и цели обозначать. Просто для того, чтобы наши с вами мыслительные действия можно было вести.

Попытка основывать рассуждения на базе заведомо ложного утверждения уж точно не прощает мыслительные действия. Наоборот.


А без цели мысль бесполезна. Она просто не работает.

Моя мысль — замечательно работает.

>Моя мысль — замечательно работает.

Попробуйте сделать из своей мысли хоть пару хоть сколь-нибудь конструктивных выводов. Извлеките из нее практическую пользу для себя :)

Мы с вами давно уже перешли из плоскости научного спора в дискуссию двух людей с разным мировоззрением. Так что давайте прекратим спорить.

Вы считаете заявление «у природы нет цели, так как нет сознания» ценным. Я считаю его очевидным и неинтересным. Мне куда интереснее проанализировать, какие цели я бы задал природе, если бы находился на месте разумного творца. Высокомерно звучит, но интересно. Потому что из этих рассуждений можно почерпнуть много инженерных идей. Или сюжет для фантастического романа.
Мне куда интереснее проанализировать, какие цели я бы задал природе, если бы находился на месте разумного творца.

Но это же совершенно другой вопрос :)
Можно отвечать на него совершенно независимо по сравнению с: "какая у природы цель?"


Потому что из этих рассуждений можно почерпнуть много инженерных идей. Или сюжет для фантастического романа.

Но тогда ответ следует брать какой-то менее тривиальный, чем "сохранение жизни" :)


И, да, если бы вы находились на месте разумного творца — то зачем бы вы сделали миллионы "лишних" галактик? :)

>то зачем бы вы сделали миллионы «лишних» галактик? :)
А кто сказал, что они «лишние»? На них тоже есть жизнь. Много разных вариантов жизни.
На них тоже есть жизнь. Много разных вариантов жизни.

Ок. Давайте вместо "лишних галактик" будет "лишних систем". Или там тоже жизнь есть по-вашему? :)

Если лично вам они кажутся лишними, это не значит, что в точки зрения вселенной в них отсутствует смысл. Как минимум, куча народа на них любуется столетиями и радуется тому, насколько они прекрасны.

Так вместо того чтобы делать большую красивую картинку где-то далеко — более эффективно было бы сделать маленькую красивую картинку рядом :)

Смысл воображения не в том, чтобы получить видео, а чтобы там были отдельные наблюдаемые объекты. Если там один объект "двигающееся изображение", такое воображение ничего не дает.
Например, здесь правильно будет если нейросеть будет распознавать понятия "столбик", "стена", "пространство", характеристики цвет, высота, их различие, сможет представить столбик отдельно от всего остального с разных сторон.
Чтобы у нейросети были информационные элементы, с которыми можно связать все эти слова, поданные на вход текстом. Или в отладчике их выделить каким-нибудь анализатором. Видео здесь скорее дальше чем ближе к тому что требуется.

Эта задача называется object detection и решается с помощью сети еще проще, чем продемонстрированная выше.
Эта задача называется object detection

При чем тут object detection вообще?

Например, здесь правильно будет если нейросеть будет распознавать понятия «столбик», «стена», «пространство»

Эта задача называется object detection

Нет, не называется, object detection — это когда вы столбики и стены на картинке ищите.

Ну да. Ищу, распознаю… Не понимаю, где мы с вами разошлись в понятиях. Для меня обвести столбик рамочкой и подписать «столбик» — строго означает «распознать столбик на картинке». А для вас?

Насколько я понимаю, object detection это определение классов, причем на конкретном изображении. Я говорю про определение конкретных объектов, и возможность манипулировать ими в дальнейшем без изображения. И самое главное, нейросеть сама должна определять список значимых фич, а не по специальному набору изображений с заранее известным результатом.

Это — разные части задачи, которые решаются отдельно. Задача первая — классифицировать объекты на картинке. Задача вторая — определить взаимосвязь между объектами, сделать предположения о развитии ситуации (эта задача, очевидно, решается LSTM-сетью типа той, которая играет в СтарКрафт).

Главное — чтобы была цель у всего этого. Можно, например, поставить перед ИИ цель выбраться из лабиринта. Но это я уже пытаюсь конкретную задачу придумать.
О каком развитии ситуации вы говорите? Тут нет такой задачи, мы же про воображение говорим. Нейросеть стоит в лабиринте и видит столбики. Правильное воображение — это не видео, а отдельные объекты. Объекты, а не классы. Чтобы если ей потом покажут картинку без желтого столбика, в воображении у нее появился этот недостающий столбик отдельно.
Фантазия — это инструмент моделирования реальности. «представить себе столбик» означает смоделировать его в сознании как часть некоторого процесса. Например, я могу вообразить, как человек ест яблоко. Какой-то абстрактный человек и какое-то абстрактное яблоко. Могу уточнить себе детали, а могу не уточнять. Но это — моделирование. А моделирование имеет цель. Например, моя цель сейчас — проиллюстрировать вам смысл понятия «воображение».
Так или иначе, если сеть способна выделить общие свойства у юнитов в Старкрафте и оперировать в незнакомой ситуации на основании имеющегося опыта, а именно этому ее и учили создатели, можно говорить именно о зарождении на этом этапе некоторого прототипа «фантазии».
«представить себе столбик» означает смоделировать его в сознании как часть некоторого процесса.

Нет. Это означает отдельный объект. Например, вы можете представить этот столбик отдельно на черном фоне, хотя никогда такую картинку не видели. Взаимодействие с другими объектами это отдельное понятие, они выражаются другими словами (обычно глаголами). Неважно, с целью или нет, важно что отдельно. Это и позволяет использовать понятия отдельно от ситуаций, в которых они появились, применять в других, комбинировать, давать названия. На картинке выше сеть объекты не выделяет, она помнит всю картинку целиком.

Представил себе столбик, стоящий на черном фоне. Стало скучно ;)

А вы, кстати, в курсе, что «стоять» — это тоже глагол, который тоже выражает действие? В этом смысле у нас получается сосем даже не просто объект «столбик» сам по себе, а связь «столбик стоит перед черным фоном». То есть он даже не совершая активных действий, всё равно, зараза, что-то делает.

Нельзя представить себе просто абстрактный столбик. Чем дольше вы о нем думаете, тем большим количеством связей с другими предметами, свойствами и действиями вы его снабжаете. Это, как раз, и есть — фантазия, которая тащит всякий «хлам» из подсознания (то есть, из предыдущего опыта) и подсовывает его в ваш «идеальный столбик».

Мой, например, получился из бетона, высотой около метра, торчащий из асфальта, слегка покосившийся, чуть-чуть надтреснутый у верхней трети, а возле него пробивается трава и одуванчик. Один. Желтый. Скучаю по лету…
Кстати, вы так уверенно заявляете, что
На картинке выше сеть объекты не выделяет, она помнит всю картинку целиком.

А скажите на милость, с чего вы это взяли?

Я вот, например, убежден, напротив, что если бы она не была способна внутри себя отделить стоблик от стены на фоне, она бы точно не смогла построить комнату с ним в перспективе. То есть я уверен, что она отделила одно от другого уверенно и четко. Просто, нам с вами об этом забыла рассказать. Это произошло где-то в глубине сети.
А вы, кстати, в курсе, что «стоять» — это тоже глагол, который тоже выражает действие?

А я не сказал "стоять") Я вообще ни про какое действие не думал. Если подумать, то скорее будет "висеть". Но суть в том, что у меня не было ассоциации ни с каким действием, но при этом я могу представить его в любом действии — стоит, лежит, и т.д.


Неважно, насколько столбик детальный. Тут я например говорю про конкретный зеленый столбик. Нейросеть не может его выделить в памяти отдельно (то есть представить).


А скажите на милость, с чего вы это взяли?

Там это видео приводится как пример воображения, я говорил конкретно о нем.


Это произошло где-то в глубине сети.

В этом и суть. Если это размазано по сети и переплетено с другими параметрами, этим нельзя оперировать, нельзя использовать в другой ситуации, любое изменение окружения может повлиять на распознавание. Отсюда же и adversarial attacks всякие.

В этом и суть. Если это размазано по сети и переплетено с другими параметрами, этим нельзя оперировать, нельзя использовать в другой ситуации


Человек расстроен. Он долго изучал способ создать искусственный разум и в итоге ему это удалось. Существо начало мыслить и действовать. Но когда он залез к нему в мозг, он обнаружил, что НЕ ПОНИМАЕТ, как оно внутри устроено, как оно работает. Злая ирония! Мы сделали ИИ, но не можем разобраться, как его нарезать на маленькие кубики, чтобы каждый кубик выполнял отдельную функцию, понятную нам.

Сюрприз! Современный Deep Learning так и работает. Никто не понимает до конца, как устроены нейросети. Я сейчас говорю не о топологиях, а о том «чуде мысли», которое позволяет нейросети не только интерполировать между двумя заданными вариантами, но и экстраполировать ответ, проявлять ту самую «фантазию». Никто не может этого понять. И это нереально круто и интересно всем, кроме зануд, которые мечтают препарировать искусственный мозг и узнать, «где же у него кнопка».
Но когда он залез к нему в мозг

Я же не говорил ничего про отладку, только про поведение самой сети.


Никто не понимает до конца, как устроены нейросети

Так они не до конца и работают как человек.


но и экстраполировать ответ, проявлять ту самую «фантазию»

Я бы не назвал это фантазией, именно потому что сеть не может представить конкретный объект.


А это значит, что она — умеет отделять объекты друг от друга

Или что там ассоциативный массив jpg -> avi.

Смысл воображения не в том, чтобы получить видео, а чтобы там были отдельные наблюдаемые объекты. Если там один объект «двигающееся изображение», такое воображение ничего не дает.

Это вопрос терминологии. То что мы называем воображением — представляя столбики или сопутствующие обстоятельства — в нейросетях называется вектором контекста. Его выделять нейросеть учится, обучаясь на больших объемах данных. Потом ей достаточно увидеть один желтый столбик, сложить эти входные данные с вектором контекста, и она получает общее представление о ситуации. Причем сложить в буквальном смысле — конкатенацией двух векторов. После чего простой регрессией из этого общего вектора она может рендерить картинку, выделять отдельные столбики на фото, да что угодно.

Вектор контекста может быть неявно закодирован в весах сети, как в этом случае, а может в зависимости от архитектуры выдаваться на выходе в явном виде, с последующей конкатенацией с текущими входными данными.

В общем случае вектор контекста (это буквально либо числа в весах, либо числа в специальном выходном векторе) содержит недостающую информацию для решения задачи. А это и есть воображение, о котором тут говорят. Знания о внешнем мире и т.д.

Есть архитектуры, в которых нейросеть представляет в динамике разные варианты развития событий (на основе предобученной model-based модели), и учится дальше чисто по своему воображению. В точности как мы, прокручивая в голове ситуации и пытаясь найти решение. Там действительно все очень похоже. Если кто-то указывает на принципиальные отличия человеческого мышления от того, что происходит в нейросетях, то это просто от недостатка знаний о современном состоянии машинного обучения. Вопрос о возможности или невозможности сильного ИИ уже давно не стоит, теперь это лишь вопрос времени.
То что мы называем воображением — представляя столбики или сопутствующие обстоятельства — в нейросетях называется вектором контекста.

Подождите, какой такой контекст. Я могу вообразить этот столбик отдельно, поместить его мысленно в другую ситуацию, представить 10 штук в ряд. Это наоборот отделение объекта от контекста, в котором он появился.


После чего простой регрессией из этого общего вектора она может рендерить картинку, выделять отдельные столбики на фото, да что угодно.

Так надо не всю картинку рендерить, как на анимации, а отдельные объекты. Тогда это будет похоже на воображение. Иначе это просто видеокодек, который работает с пикселями.
Если я правильно понимаю, конкретно у этой нейросети нельзя взять часть вектора контекста и отрендерить из него зеленый столбик на темном фоне с разных сторон, который не будет двигаться по экрану как он двигается на полном изображении? Ну, без низкоуровневых хаков типа брать из вывода нейросети ограничивающий прямоугольник.


Вопрос о возможности или невозможности сильного ИИ уже давно не стоит, теперь это лишь вопрос времени.

Согласен, я говорю лишь о технических различиях.

Подождите, какой такой контекст. Я могу вообразить этот столбик отдельно, поместить его мысленно в другую ситуацию, представить 10 штук в ряд.

Вы это всё когда-то видели. В той или иной степени сходства. Возможно, десять в ряд не видели, но видели три в ряд. А дальше — экстраполируете.

Фантазия — это перебор известных элементов в новые конструкции. В качестве доказательства приведу очевидную мысль. Может существовать слепой от рождения скульптор. Но слепой от рождения художник существовать не может.

Бетховен писал музыку, бдучи глухим, потому что его мозг был достаточно нартенирован, чтобы представить себе, как звучат записанные ноты. Слышать было уже не обязательно (хотя не дай боже оказаться на его месте). Но будь он глух от рождения, не было бы великого композитора.
Возможно, десять в ряд не видели, но видели три в ряд. А дальше — экстраполируете.

Ну и что? Это никак не противоречит моим словам, даже подтверждает. Именно представление объектов по отдельности и дает возможность экстраполировать и комбинировать.

Я уже выше писал про это.

Топология, которую научили создавать пространственное представление по фотографии, внутри себя — в скрытых слоях — отделила объекты от фона. Без этого она бы не смогла работать, потому что минимальная последовательность действий — найти, отделить, перегруппировать — должна быть выполнена.

А это значит, что она — умеет отделять объекты друг от друга, просто мы не понимаем, как она это делает.

Наше с вами непонимание процесса мышления не отменяет факт существования этого процесса.
НЛО прилетело и опубликовало эту надпись здесь
Действительно, интересно, есть ли какой-то уровень абстракции, на котором нейросеть выделяет объекты из изображения? Или так и работает, как чёрный ящик — нарисуй юнитов иначе и обучай всё с 0 по-новому?
Не думаю, что нейросеть работает с изображением, т.к. это тупая нудная задача, которая имеет практически тривиальное решение, но вносит дополнительную вероятность ошибки. Скорее всего сеть на вход получает координаты и данные юнитах и зданиях, которые не скрыты за туманом войны.
Важно отметить, что скорость действия программы и её область видимости на поле боя были ограничены, чтобы AlphaStar не получила несправедливого преимущества над людьми.

На другом ресурсе видел информацию о том, что хотя туман войны и был для ИИ, но по имеющемуся API программа получала информацию о видимых вражеских юнитах на всём видимом участке без необходимости двигать камеру. Когда эту возможность отключили человек выиграл. Но была оговорка что в таком режима ИИ учился играть намного меньше времени.
Только в последней игре (в которой выиграл MaNa), была имплементирована имитация камеры. Перед этим один агент ИИ (их выбрали 5ш, разных) выиграл за счёт лучшего микроменеджмента (то есть не обязательно «мозгом»). Пока потенциал текущей версии AlphaStar не раскрыт полностью, так как не особо тренировался с профессионалами (imho это не очень то и дошло до TLO и MaNa).
Нашел — nplus1.ru/news/2019/01/25/en-taro-alphago
Стоит отметить что все же небольшое преимущество у AlphaStar было — несмотря на то, что туман войны закрывал карту для нейросети так же, как и для человека, программа получала для обработки не частичное изображение известной области (условный экран), а видела сразу все, что позволяет увидеть игра. Благодаря этому нейросети не приходилось постоянно переключаться между разными зонами карты для контроля за происходящим. Когда же для еще одного демонстрационного матча с MaNa разработчики заставили AlphaStar играть с обычным ограничением масштаба видимой области, то нейросеть проиграла человеку. Правда, в DeepMind отмечают, что самостоятельно двигающая камеру версия программы обучалась в «лиге AlphaStar» всего семь дней.
678 APM — это же ~11 кликов/нажатий в секунду. И это среднее значение.
Это определённо выходит за рамки моего понимания человеческих возможностей. о_о
Хоткеи входят сюда же, и (вроде) приказ группе из 10 юнитов = 10 действий, поправьте если тут не прав. С хоткеями уже смотрится вполне реалистично, с групповыми приказами — более чем.

Хоткей — да, групповой приказ — нет. Впрочем 678 — это реально занадто. Чемпионы играют 250-350, хотя смотря за какую рассу.

При этом большинство этих кликов — это бездумные клики в одно и то же место. Дай бог, десяток процентов осмысленных команд отдается. У бота же все его ~600 APM осмысленные.

Последний матч в трансляции показывали от лица игрока. В правом нижнем углу камера периодически показывает его руки. Ну и в ролике про TLO тоже было.
Я хотя и не отношусь к свидетелям шапочки из фольги, но если предоставить такой системе достаточно масштабирования и данные в применимом формате — её можно будет применить в военных целях. Только управлять она будет реальными пехотинцами, танками, авианосцами и т.д. пусть даже как военный советник.
Вот только населения планеты не хватит чтоб обучить такую систему :)
Это просто к тому, что в играх нет и десятой доли всех возможных вариантов развития событий из реальной жизни (в том-же старкрафте нет дезертиров, морали, погоды и т.д.)
Или вон как на недавних учениях — столкнулись два корабля НАТО :)
Все учесть невозможно, так что только на реальной жизни и можно обучать систему для реальной жизни…
GO тоже считалась непостижимой для машин, ввиду количества комбинаций, буквально пару лет назад.
Тут тонкость в том, что с го можно было виртуально прогонять бесчисленное количество партий, чтобы обучить нейронку всем возможным вариантам развития событий.
А вот с реальными боевыми конфликтами так не получится. :)
Ничто не мешает то же самое прогонять в симуляторе типа ARMA III, приближенному к реальности, запустить такой интеллект на сервера для игры с людьми и научить его воевать. В реальном конфликте число комбинаций хоть и будет астрономически велико, но будет конечным, интеллект на то и интеллект чтобы подстраиваться по мере изменения условий, используя не только накопленный опыт, но и например психологию людей, будь то шахматы или война в условиях городского боя. Все ии проигрывают поначалу, пока учатся, только со временем вырабатывают иммунитет к каждому приёму. Если военным такая идея понравится, они её шустро профинансируют, как было со многими технологиями до этого.
И почему тогда советниками генералов сейчас не берут задротов ARMA lll, если все так просто?
Потому что генералы командуют армиями а не взводами, масштабы совсем не те, предвкушая следующий вопрос про командующих взводами — военных «выращивают» для выполнения поставленных задач а игроков нет. Однако я знаю хороший пример — настоящие военные лётчики первое время проигрывали на тренажёре «задротам» конструкторского бюро Сухого. Т.е. смысл ситуации такой же — обычные инженеры (не военные и не лётчики) которые много тренировались на симуляторе, побеждали раз за разом обученных и подготовленных военных профессионалов, пока те не подтянулись до их уровня на симуляторе.
Ну количество комбинаций не то-же самое. Правила там четко формализуемы, а не так, что с какой-то вероятностью параметры юнитов могут измениться (и на сколько) из-за погоды. Хотя пусть система еще и обучается сразу в плане предсказания погоды, чтоб это учитывать :)
Чтоб система этому научилась надо все это заложить в «правила». Даже варианты того, что прапорщик разбавил топливо, солдаты напились, а генерал продал план наступления противнику. И разных сценариев (а тем-более их сочетаний) можно придумать столько, что невозмножно будет в обозримое время заложить все это в программу обучения.
Ну и количество вариантов срабатываний разных событий мне кажется легко переплючент количество вариантов в ГО :)

Дезертиры, мораль, погода, это всего лишь дополнительны параметры которые можно оцифровать и работать с ними как с вероятностями. Проблема только в обучении, в реальной жизни обучить сложновато, не хватит людей и русурсов, а вот создать симуляцию боевых действий пусть даже не со всеми возможными параметрами уже даст многократное преимущество перед противником.

пусть даже не со всеми возможными параметрами

И если при проверке в реальности возникнет такой неучтенный параметр, то все что планирует делать ИИ идет в топку, т.к. он просто не поймет что произошло.

И это если говорить про какие-то параметры, которые можно предположить, а вот как быть с управлением техникой? Мастерство экипажа в симуляциях одинаковое для всей однотипной техники, а в реале это очень сильно разнится, и один и тот-же самолет будет показывать разные результаты в зависимости от пилота — будем учитывать в симуляции каждого человека? Так у нас нет их параметров, есть только ТТХ техники…

Мне бы очень хотелось посмотреть на ИИ в настолках с кубиками (например тот-же Вархаммер). Вот где куча вариантов состава армии, и куча рандома в виде кубиков, и пусть попробует собрать армию против любого противника, да еще и научится играть не зная, как войска себя поведут, это только в старкрафте войска беспрекословно выполняют приказы и всегда попадают в цель.
Нет, научится не играть, а выигрывать.
Дезертиры, мораль, погода, это всего лишь дополнительны параметры которые можно оцифровать и работать с ними как с вероятностями.

Если вы это сделаете, то сможете легко выиграть любую войну и без ИИ.

Только воевать в таком стиле сейчас не с кем. Могут покрасоваться, пригнать пару авианосцев, побомбить муджахидов на ослах. Могут точечными ракетными ударами уничтожать склады с оружием. Танки сейчас тоже скорее для красоты, уничтожаются на счет раз с ПТРК (ПЗРК для вертолетов) стоимостью на 3 порядка меньше чем тот танк.
ИИ может пригодиться в автономном вооружении, умных ракетах, дронах.
Танки сейчас тоже скорее для красоты, уничтожаются на счет раз с ПТРК

А люди уничтожаются из автомата, сейчас тоже скорее для красоты, корабли уничтожаются торпедой, сейчас тоже скорее для красоты, самолеты уничтожаются ракетой…
Может не стоит так категорично утверждать?
Танки в городе продвигаются со скоростью 50м/час. Из любого угла им бок в упор прожигают. На ютубе есть реальные бои. Танки эффективны только для подавления на открытой местности издалека пехоты, вооружённой только калашами, аля ВОВ. В бою с современной регулярной армией без подавления вертолётов хоть всю колонну выжигай. Как говорится, «генералы готовятся к предыдущей войне».
Ага. А генералы то не знают. VDG своими глазами на ютубе видел, что в город на танке нельзя.
В пехотинца тоже снайпер из любого угла. Это не говорит о том что пехоте в город нельзя. А танк — это лучшая броня из придуманной, да не идеальная, но ничего лучше нет. Плюс пушка на гусеницах. Может сложить целое здание. Естественно танк без пехоты не идёт. И пехоте без танка неуютно. И тыл должен быть прикрыт, а не на середину площади с разбегу. И все последние конфликты в Сирии и Донбассе только подтверждают необходимость танков в том числе в городских боях.
Реальный бой. Пара десятков солдат пряталась за жопы пяти абрамсов, пока те два часа(!) долбили хибару в ста метрах, где прятались несколько «повстанцев» с ПТРК. Один абрамс имел дурость подползти на 40 метров и тут же получил в бочину из-за угла.

Ваши «все последние конфликты» — это не война, а локальные подавления бегающих с калашами. Будь это настоящий соперник, он за 100км мимоходом выпустил бы пару ракет, и сгорели бы все эти железные тушки. И не важно, прикрыт у них был «тыл» или нет. Вылезайте из WOT.
Да, вы правы, сейчас нужны только ракеты по сути, и противоракеты как защита от них. Разбомбите ракетами мосты и электростанции и склады амазон и всё, противник не страшнее стайки обезьян в джунглях.
Танки, пехота и прочее, могут пригодиться в локальных конфликтах для подавления незаконных бандформирований. А исходно я полез в дискуссию о том, что ИИ якобы мог бы пригодиться для просчета какой-то тактики на поле боя, что неактуально уже лет как минимум 50.
Вы случайно Доктрину Дуэ. Только она того, не работает как-то. Единственный пример — Югославия, но там совсем уж неравные силы. Уже в Ираке через 4 года пришлось по старинке, пехотой и танками воевать.
А давно это было, в Ираке? Дроны тогда были уже, через которые точно определяли где базы/склады боевиков, чтобы потом туда ракеточкой-другой жахнуть?
Вовсю использовались еще с Югославии. Плюс спутниковая разведка. Разница с сегодняшними возможностями, конечно, есть, но не драматическая.
но в начале потратит тыщи солдат на учебные бои с собой :)
Боевые действия — это не стратегия, где выделил юнитов мышкой и отправил в бой. Главные преимущества получаются путем разведки, шпионажа, двойного шпионажа, лжи, введения в заблуждение, неожиданных атак, переговоров, политики и т.д. Кучу проблем доставляют всякие бытовые проблемы вида как прокормить мобилизованную сотню тысяч человек или доставить боеприпасы. Если почитать искусство войны Сунь Цзы, то окажется, что уже как не одну тысячу лет победа в войнах закладывается задолго до начала боевых действий, лобовые столкновения — это уже завершающий этап. Провести начавшееся сражение — это тривиальная задача для которой ИИ не нужен.
В Старкрафте в играх между людьми есть почти всё перечисленное. По-моему нет только двойного шпионажа, политики и логистики. Но зато есть многое, что недоступно в реальных боевых действиях, поэтому стратегии могут быть очень разнообразными.
Ну, я ждал, я смотрел. Но после того как первый раз раскатали TLO просто вчистую уже дальше смотреть не стал — все было понятно. У ИИ было ограничение в 180 АРМ, но оно реально успевало больше, чем TLO, хотя бы в анализе. Например, в то время как TLO кинулся в первые атаки в надежде на быструю победу, он упустил, как мне показалось, сбор ресурсов и построение новых юнитов, в то время как ИИ после контратаки просто заваливало его свежими юнитами до окончательной победы.
P.S. Я даже представить боюсь как оно будет играть за зергов.
В другой теме писал, но оставлю и здесь. Неплохой комментарий каждого матча от
Алекса007

Что и требовалось доказать, когда ИИ был поставлен в равные с человеком условия, он уже выглядел не так блистательно. Прямо говоря -«сдулся».
Сдулся, потому что не тренировался в таких условиях. Для этого он поиграет еще недельку и будет на том же уровне, что и с картой.
Для этого он поиграет еще недельку и будет на том же уровне, что и с картой.

Дудки, он «сдулся» потому что заставили играть с ограниченным объемом информации. Т.е видит не всю карту, а как человек — кусочками.
Его проблема в том, что он Ф2-чил… войском водил хороводы. А мозгов не хватило построить Феникс. С учетом уровня игры, которого достиг ИИ за 2 неделю, думаю, что на тысячную игру он был «допер» как этому противостоять, возможно даже раньше. Но это не точно.
Всю карту Alpha Star не видел ни в одной игре, его информация была так же ограничена «туманом войны», как и для человека. Суть тут в том, что во всех играх, кроме последней, Alpha Star не был ограничен своим экраном, а как бы выдел одновременно всю не скрытую «туманом войны» ему как игроку территорию.
Опустили пользование камерой — это преимущество ни о чем. Давайте теперь отменим превосходство над человеком шахматных ИИ потому что они не могут перемещать фигуры на настоящей деревянной доске.
Во многих стратегиях (если не во всех) изменение предела максимальной «высоты» камеры является читерством.
Сам факт того, что ИИ УЖЕ СЕЙЧАС приходится «ставить в равные с человеком условия» намекает на превосходство ИИ. Рост быстродействия машин будет только расти, как и рост сложности алгоритмов ИИ.
С другой стороны, если уж была бы задача «поставить ИИ в равные условия с человеком», то надо было создавать аппаратную человекоподобную платформу, а не эмулировать ограничения. Т.е. играть должен был человекоподобный робот (причём без подключения к сети), таращащийся в монитор и тыкающий механическими пальцами в клавиатуру и мышь. Вот если бы такая связка обыграла бы профессиональных игроков, то это бы реально пугало…
Весь вопрос в микроменеджменте": Сдвинуть юнит на 2 пикселя", «огонь», «через 212 мс на 4 пикселя назад»таймаут 0,5". Вы точно так представляете себе битву с ИИ? Даю прекурсор — Вы никогда его не победите в микроменеджменте, вы чисто человечески не сможете — анализ всей карты всегда превалирует над анализом областей.

У калькулятора тоже превосходство в вычислениях, это ничего не означает.

Пока ИИ не выиграет какой-нибудь даже простенький турнир в интернете — это все ни более, чем хайп. Сама новость полна абсурда:
Заголовок: «ИИ обыграл профессионалов в SC2 10-0!»
Где-то далеко внизу: «ИИ играл за одну расу, один матчап, на одной карте, с полным контролем всей карты, не закрытой туманом войны, по одной игре с разными агентами (т.е. без возможности людей адаптироваться)».

Не многовато ли ограничений? Пока звучит как: «ИИ смог обыграть человека в шахматы! Правда, человек играл без ферзя, слонов, коня и ладьи. А еще ему нельзя было ходить на клетки по е6, е2 и б4 и можно есть фигуры соперника только первыми тремя пешками».

Я даже не удивлюсь, если матчи были подтасованными и сыгранными по сценарию. TLO вообще детские ошибки допускал с варпом сталкеров на поле боя.

Не хочется умалять заслуги разработчиков, которые сделали то, чего раньше не делал никто, но стоит объективно оценивать результат. Правда на такую объективность денег не выделят :(
Вы видимо не в курсе что такое про сцена СтарКрафта. Нет игроков которые на профессиональном уровне могут одинаково сильно играть всеми расами, даже человек выбирает какую-то одну. Так что мачап против Маны вполе себе может сойти за финал какого-нибудь чемпионата между двумя протосами которые прошли через сетку.

А про невозможность людей адаптироваться это просто смешно. Мана входит в 10ку лучших игроков-протосов планеты, поверьте, на своё обучение он потратил гораздо больше времени чем этот ИИ. И на таком уровне просто не сущестует понятия «адаптироваться». Те игроки к которым можно адаптироваться ничего не достигают.

Но смысл же не в этом. Я удивляюсь комментаторам которые пытаются доказать, что ИИ в чём-то вёл себя «нечестно». Да ребят, ему не нужно нажимать на клавиши, смиритесь. Чтобы соответствовать вашим представлениям о «честности» я так понимаю дип майнд должны посторить андроида да?

Вы можете сравнить с предыдущими достижениями в этой области habr.com/ru/post/370431 вот статья например и осознать что это просто невероятный скачок вперёд.

Вот что сам MaNa пишет на реддите, когда его спросили, чем бот был лучше/хуже человека:


I would say that clearly the best aspect of its game is the unit control. In all of the games when we had a similar unit count, AlphaStar came victorious. The worst aspect from the few games that we were able to play was its stubbornness to tech up. It was so convinced to win with basic units that it barely made anything else and eventually in the exhibition match that did not work out. There weren’t many crucial decision making moments so I would say its mechanics were the reason for victory.

То есть, бот тупо рашил базовыми юнитами не особо заботясь о стратегии, и это работало. В этом нет никакой особой интеллектуальности, тупо победа за счет лучшей механики микроконтроля.


Это как называть бота в Counter-Strike прорывом в ИИ и скачком вперёд, потому что он хедшоты делает со 100% точностью. "The goal is to create artificial intelligence, not artificial aiming"

Есть лишь один вопрос. Почему до вчерашеного дня никому и никогда не удавалось создать бота для Старкрафт который бы победил человека даже имея неорганиченыц АПМ и скрипты для микроконтроля?

Потому что со всем остальным (кроме бешеного APM) у тех ботов было совсем плохо, они были слишком «запрограммированные» и негибкие, что позволяло легко найти брешь в их алгоритме и нагнуть их.


Но при наличии минимального интеллекта у игрока (что DeepMind вполне себе демонстрирует), сверхчеловеческое микро уже не «контрится» — тонкий игровой баланс Старкрафта на такое просто не рассчитан.

Вы же понимаете что никто специально не задавался целью обыграть про игрока в старкрафт/шахматы/го — просто сложность задач с каждым разом становится всё выше. Я ещё раз говорю вам, суть не в этом. Сравнивается не человек/ии, а предыдущие достижения ИИ с текущими. Человек однозначно проиграет в этой борьбе, тут даже никаких вопросов нет. Люди долго не признавали поражение в шахматах, но в конце концов смирились.

Это как в средневековье пригнать трактор и говорить, что нечестно на нём побеждать на рыцарском турнире, вы же в него соляру заливаете, а не овёс. Но трактор-то не для турниров, на тракторе поле можно вспахать, ребят.
Человек однозначно проиграет в этой борьбе, тут даже никаких вопросов нет.

В доте все еще не проиграл :)
И есть еще один немаловажный момент — изменения правил у игр. Баланс часто меняют, патчи выходят регулярно, и человек к ним подстраивается намного быстрее, а ИИ придется тренировать по-новой в некоторых случаях.
Я понимаю это, но это же ведь скорее подтверждает откровенную фейковость заголовка «ИИ победил про в SC2» и подтверждает мои слова про то, что игра была с ограничениями для людей/форой для бота.

По поводу честности: к таким заявлениям приводят желтые заголовки. Никто не спорит, что это очередной огромный прорыв в области обучения ИНС человеческим играм. Претензия именно к прямому обману обывателя, который, не разбираясь в деталях, будет думать, что «скоро будем жить в постапокалипсисе из терминатора».

P.S. По поводу времени на обучение: а давайте посмотрим не по критерию «время на обучение», а по критерию «количество игр, на которых был обучен ИИ». Все зависит метрики, по которой сравнивать.
Я удивляюсь комментаторам которые пытаются доказать, что ИИ в чём-то вёл себя «нечестно». Да ребят, ему не нужно нажимать на клавиши, смиритесь.

Смотрите. Если вы на бнете будете микрить сталкерами как АльфаСтар, то вас забанят ;)

Мана входит в 10ку лучших игроков-протосов планеты, поверьте, на своё обучение он потратил гораздо больше времени чем этот ИИ.

А если в количестве игр посчитать?

Уточнение: ИИ не видел скрытые туманом войны области. Он просто видел карту разом. Как играть на растянутой миникарте.

Во многом согласен, но разные агенты это, объективно, плюс в копилку AlphaStar.
Пока мир не может сделать одного бота чтобы побороть прогеймеров, ребята одновременно сделали 5 разных, со стабильно хорошими результатами.


Адаптироваться на лету к разным противникам это как люди выигрывают на ладдере, турнирах и становятся прогеймерами.

Ничего выдающегося. Игроки не из топ-10, и вообще не корейцы. Есть к чему стремится.

Ну корея уже не чемпионы евли уж формально смотреть на последний чемпионат.

Самое забавное, что эти трюки можно использовать в качестве датасета для изначального обучения сети. И она попытается их повторить. Возможно, успешно.

А вообще, если Близы не профукают такую возможность, они смогут доточить баланс до идеального. Например, добавят маленький откат навыку «сесть в бункер». Сделают блинк не мгновенным, а занимающим, скажем, 10 миллисекунд (чтобы снаряд успел попасть). И т. п…

На даннвй момент игра сбалансирована только на уровне человеческой реакции. Но никто не мешает сделать ее такой, чтобы уравнять шансы как для людей, так и для «сверхлюдей».
Почему никто не отмечает важные отличия игры AlphaStar от игры человека?
— Он лучше строит, почти всегда у AlphaStar больше ресурсов и юнитов.
— Он лучше микрит, stalker с blink у ИИ практически бессмертный. Такая эффективность управления недоступна человеку и ломает баланс. Immortal должен побеждать stalker, но нет, под управлением ИИ stalker побеждает.
— Он может разбивать армию на много кусочков, окружать и «дергать» армию противника со всех сторон. Человек такого не может, просто не внимания.
— Он не учится в процессе игры, прилетел дроп, и AI продолжал гоняться за ним пока не проиграл.

AlphaStar в основном побеждал за счет нечеловечески точного и быстрого управления юнитами. Он не показывал чудеса стратегии или какие-то крутые игровые идеи. Просто он умеет быстро елозить мышкой и делает это в 1000 раз быстрее и точнее человека. Надежда людей в этом противостоянии только на то, что всю дурь из AlphaStar не получится выбить и всегда будут новые стратегии, к которым он не готов, как тот дроп из 2х immortal.

И надо быть справедливым к людям, если бы они играли с AlphaStar несколько дней подряд, то счет был бы 0-10 в пользу людей. Уже в 6 игре Mana нашел фатальный недостаток у ИИ.

Просто если бы они выставили адекватное ограничение APM (думаю они пытались), то игроки-люди разделали бы бота под орех, и никакой красивой презентации для инвесторов не вышло бы. А у них дедлайны, надо что-то показать.


Вот тут AMA на reddit с разработчиками, и там выясняется что лимитер APM был настроен так, что даже (теоретически) допускались кратковременные burst'ы под 2500 APM (на практике мы видели 1500 в боях), что конечно полный бред, ни один человек никогда так не сможет кликать — чисто физически эффективный APM не может быть выше 200-300, все что выше это бессмысленные «раскликивания», возможно даже с помощью макросов клавиатурных. Причем бот кликает с суперточностью, ему не надо рамкой выделять юнитов и елозить курсором, он может суперточно выбрать любой набор юнитов в любых местах карты одновременно — ему даже и камерой не нужно было елозить, он играл с «зумхаком» все игры кроме последней (где он позорно слился). Это профанация полная, рассчитанная то чтобы впечатлить и убедить тех, кто в SC никогда не играл. Манипулирование числами и статистикой (это я про их «средний APM даже ниже чем у игроков-людей» и красивые графики распределений, где сравниваются яблоки и апельсины).

Ну я бы не был так категоричен. Вы конечно правы что у ИИ преимущества в виде точности и более высокого АПМа. Но:
Если верить этому графику, то средний АПМ был выше не у ИИ, а у MaNa (390 vs 277), при этом максимальный — у TLO (2000 vs 1600).
Конечно надо учитывать что у TLO такой высокий апм из-за хоткеев (багнутая фича — частое использование хоткеев сильно завышает АПМ). И конечно у ИИ нет спама, в отличие от людей. Поэтому возможно в 2-3 раза выше эффективный апм, но не на порядки же.
«Зумхак» тоже преимущество, но бот по-прежнему оперирует неполной информацией (ту же информацию имеет любой про-игрок который смотрит на миникарту — тот же Серрал потому и выигрывает всегда; у него отличный map presence, вне зависимости от того где его камера в какой-либо момент).
Ну и 200-300 эффективный АПМ физически всё же возможен, если использовать множество способностей, хоткеев (уместных) и быстро-часто направлять юнитов по какой-нибудь оптимальной кривой.
В конце концов печатать-то люди вполне успешно умеют с эффективной средней скоростью в 700-1400 букв минуту (не все, конечно, но всё же — достаточно взглянуть на klavogonki.ru).
А так — я, как мл-тосс, впечатлён. Убрать все преимущества и подучить нейросеть играть «с камерой» — и всё равно будет игрок уровня грандмастера. Да даже сейчас думаю он как минимум любого мастера обыграет в большинстве случаев, даже если сильнее АПМ поуменьшат и «с камерой».
А самое главное — со стороны не то чтобы легко отличить, компьютер или человек играет.

У ИИ есть спам

Только в тех ситуациях, когда APM больше «не на что» было потратить эффективно, т.е. не в моментах интенсивных стычек. Этому AI научился у людей, так как первую версию обучали на реплеях, перед тем как она начала играть сама с собой. Но поскольку это не влияло на винрейт, ИИ «не смог забыть» эту привычку. А вот в критические моменты он тратил свой APM очень эффективно, так как это влияло на винрейт при обучении.

Этот график — профанация и притягивание за уши… Какой нафиг APM в 2000 у человека, и какая разница какой APM «средний» если важно то, какой он пиковый в критические моменты игры, и какой процент полезных действий в этом APM, ведь большая часть человеческого APM это спам-клики и перемещение камеры, при том что боту же даже камеру перемещать не надо было.


Вот очень хороший пост в /r/MachineLearning где все четко расставляют по полочкам:


An analysis on how AlphaStar's superhuman speed is a band-aid fix for the limitations of imitation learning


> Поэтому возможно в 2-3 раза выше эффективный апм,


Но в Старкрафте это гигантское преимущество и полностью меняет игру, при в 2-3 раза большем APM чем у топовых прогеймеров, оптимальным стилем игры становится массить блинк сталкеров и давить ими c трех сторон одновременно. В Старкрафте в балансе многое рассчитано на то, что идеальный контроль у человека невозможен, и баланс старкрафта во многом про искусство эффективного менеджмента ограниченного количества действий в секунду. Если его не ограничивать, то игра просто теряет смысл.

Во времена актуальности WC3: RoC научился разводить 8 эльфийских лучниц в полумесяц за полсекунды, т.е. 16*60*2=1920 честных APM в моменте. Вот удерживать такой APM без спама человеку не удастся.

"Он не учится в процессе игры, прилетел дроп, и AI продолжал гоняться за ним пока не проиграл."


Чисто технически это можно сделать, нет проблем. Проблема в необходимости огромного количества материала для обучения.

Не обязательно, что это можно сделать в принципе. То есть, конкретно этой нейросети «бесконечным» обучением залепить все «дырки» в ИИ при решении такой сложной задачи, как игра в Старкрафт. Как никогда сверточные НС не смогут 100% определять что изображено на картинке (просто потому, что сопоставляют картинку обобщенному образу из обучения, а не анализируют что именно изображено — а значит кот, который вклеен внутри собаки, которая замаскирована под слона гарантированно взорвет «ИИ» «мозг»), так и человек, получив свободный доступ к такому ИИ, довольно быстро найдет способ ему противостоять — как «атака пикселем» в случае картинок. Именно на макроуровне — определенным видом билдордера или раша.
Но надо отдать «Дипмайнду» должное, в плане «микро» он весьма неплох.

А вообще, если устраивать соревнование «человек против машины», мне кажется, человеку тоже надо выдать пачку костылей, для компенсации. Самым простым будет уменьшение скорости до Normal, чтобы примерно сравнять возможности по микро-контролю.
Старкрафт-2 все-таки не только и не столько стратегия, сколько соревнование «кликеров», он нарочно неудобный для определенных вещей. Хотя и гораздо более простой нежели первая часть серии, где нужно было совсем всё-всё делать руками — например, вейпоинты на минералы не работали, у выделенных «магических» юнитов не работали способности, если к выделению примешивались юниты другого типа, а сами способности «кастовались» у всей группы на одну и ту же точку. Наверное, у «alphaGo» в этом случае было бы еще больше преимуществ.

Я повторю,
Чисто технически
. Обновлять веса нейронки в процессе игры — легко.
После просмотра последней карты возник вопрос, если ему не ограничили поле видимости он бы так же отбивался от дропа?
В целом мне не понравилось, они просто вывели идеальные билды и тайминги и тупо перемасили и переконролили человека.
Я бы лучше посмотрел против кингкобры, который я думаю его бы в легкую зафатонил.
И ещё, нужно было дать время подготовиться игрокам, если б они нашли слабые стороны значит это херовый ИИ, если б ИИ в процессе адаптировался значит хороший.
Как забавно читать, когда обычный человек, начинает критиковать игру уровня профессионалов. Всегда слышится «а мой брат бы твоего легко победил — он у меня сильный, дом поднимет одной левой!»

Я думаю, что пока оно училось играть на уровне алмазной лиги, оно весьма успешно научилось отбиваться от фотонок. И не только.

На последнем матче была выпущена явно сырая, недоученная сетка. Он не отбился не из-за ограниченного поля видимости, а из-за того, что он не научился в новой механике правильно ориентироваться. Возможно, надо было доработать топологию. Ошибка со сталкерами, пытавшимися достать дроп с берега — вообще похожа на программерский баг. Хотя, я деталей не знаю — утверждать наверняка не могу.
НЛО прилетело и опубликовало эту надпись здесь
Истину глаголите.

Вот только нюанс: для того, чтобы отдать приказ боевой единице не чаще, скажем, чем раз в секунду, надо на эту секунду вперед прогнозировать. Именно способностью к долгосрочным прогнозам на основе неточных данных до сего момента человек обыгрывал ботов. И именно по причине куцей способности к предсказанию, бот вынужден «перекликивать» человека в разы, чтобы играть на том же уровне. Он тупо меняет мнение с частотой 100 герц.

А бот, основанный на нейросетях, «мыслит» так же, как и мы с вами. Он оценивает свои шансы, прогнозирует и отдает приказы на несколько секунд вперед. Именно поэтому у него, как у человека, APM так сильно плавает, в зависимости от того, насколько «горяча» ситуация. И, да, он не промахивается по юнитам и не делает лишние тычки. Но, полагаю, прогеймеры тоже промахиваются довольно редко, а «тычками» только руки прогревают. Так что оценка APM довольно объективна.
Посмотрите 11ю игру на канале alex007sc2 и увидите что никакого более-менее долговременного прогноза у бота нет. Мана высаживает дроп — бот ведёт всю армию на базу, Мана забирает дроп — бот ведёт всю армию в атаку, и так несколько раз, никакого понимания кроме текущего момента
«Ага, — сказали суровые сибирские мужики»

Вот в который раз убеждаюсь, что людям нельзя показывать полработы. Извините.

В десяти играх машина успешно предсказывала поведение игрока, делала контры (без этого она бы продула даже в алмазе) и играла на высочайшем уровне. И я говорю не только про пресловутый APM. Простой смертный бы ее и с зарезанным APM-ом не обыграл.

Но стоило товарищам провести ПУБЛИЧНЫЙ эксперимент и выдать НЕДОДЕЛАННУЮ сеть (другую, при том), которая сделала явно тривиальную ошибку, как эта ошибка распространяется на всю серию экспериментов и объявляется универсальной.

Неужели не очевидно, что тут явная бага была? Они что-то не учли. Возможно, в топологии, возможно — в контексте.

В подтверждение моих слов уточню: если бы она в первых десяти играх не могла прогнозировать (а это ей приходилось делать ибо юниты противника она и там не видела), то что же тот же MaNa не размазал ее таким же (или сходным) очевидным способом? Зачем ему было продувать 5 игр, чтобы отыграться в 6й?
В десяти играх машина успешно предсказывала поведение игрока, делала контры

Действительно, общеизвестно же, что сталкеры — это контра имморталам!


В подтверждение моих слов уточню: если бы она в первых десяти играх не могла прогнозировать (а это ей приходилось делать ибо юниты противника она и там не видела), то что же тот же MaNa не размазал ее таким же (или сходным) очевидным способом?

Потому что нейронные сети не умеют прогнозировать. Альфазеро не прогнозирует, что будет строить противник, это не человек. Она не рассуждает. Она просто знает, что, статистически, если в момент Х строить юнита Y и потом отсылать его в Z — вероятность победы выше.

Более показательно было бы выступление бота в пошаговой стратегии с неполной информацией а-ля герои 3, цивилизация. В старике микроконтроль многое решает. Можно не быть супермозгом, но тупо перекликать.
Цива с нормальным ИИ… Мечта всей моей жизни :)

Давайте напишем петицию в DeepMind, чтобы они сделали ИИ для Civilization 5 или Civilization 6. И там, и там комп безобразно играет.
Коллеги, можете пояснить, по каким критериям считался проигрыш? Игрок пишет GG хотя вроде и база цела и добыча не остановлена и остатки армии пристутсвуют? (Я играл в TA, механика старкрафта мне не очень очевидна)
Ну, это очень субъективно. Игрок принимает решение сам, что на каком-то этапе его дальнейшее сопротивление в любом случае станет поражением.
Интересно, насколько далеко уйдут подобные алгоритмы где-нибудь на валютной бирже?
Биржи — это саморегуляция, при этом держится все на утверждении — одни обогащаются за счет других. Т.е. главное, каждому новому трейдеру приходится сражаться против всей совокупной силы и разума тех кто уже имеет там опыт.

Лет десять назад нейронные сети уже давали профит, трейдерские форумы об этом говорили…

p.s. на истории не научиться как следует, учиться надо на реальных действиях ибо каждое действие меняет реакцию рынка, но для нейронных сетей нужны данные и желательно значительно больше чем кажется необходимо. Конкретно этот обсуждаемый ИИ использует следующий подход — играть сам с собой, т.е. чтобы создать торговый алгоритм, ему необходимо создать эмитатор рынка, который ведет себя похожим образом… это конечно решит задачу получения дохода но выглядит слишком избыточной по сложности, что то мне кажется эта задача пока не по зубам.
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации