Как стать автором
Обновить

Комментарии 46

Пройдет ещё немного времени, и такие машины всего с одним чипом TPU, способные предугадывать действия человека, будут стоять в каждом фонарном столбе и при первых признаках девиантного поведения вызывать карету до вытрезвителя.
А в случае более продвинутого алгоритма — вызывать и «электрического пса» с ядовитым жалом.
А в спокойном состоянии транслировать рекламу.
Зачем им транслировать рекламу? Оценить потребность конкретного человека, найти товар, заказать вместо него и отправить ему посылкой на дом почтой-такси в любую точку мира. При правильном анализе возврата товара не будет или крайне мало, можно и не замечать.
Без рекламы релевантных товаров будет слишком мало.
НЛО прилетело и опубликовало эту надпись здесь
Смысл рекламы отнюдь не в том, что бы продать человеку то, что ему надо.
Если бот АльфаПродавец будет продавать успешно без рекламы, то зачем она нужна?
Реклама вызывает потребность, которой у человека не было до просмотра рекламы.
Не думаю что потребность можно создать. Вот проявить — запросто. Вот не было у меня робота-пылесоса, никакая реклама не заставит меня его купить если не захочу. С другой стороны, если товар мне интересен, то почему бы это не проанализировать и не продать его мне по предзаказу по предпродаже*?

*Здесь предпродажа — противоположность предзаказу, когда вначале товар, а спустя время, если понравится, деньги.
Не думаю что потребность можно создать.

Я уверен, что успешно практикующие маркетологи с вами не согласятся.
И что значит проявить? Вы уверены, что все «проявленные» потребности действительно назревали в сознание раньше? Вы думаете, что люди, покупающие роботы-пылесосы, действительно имеют четкую и осознанную потребность в оптимизации рутинных домашних задач? Сомневаюсь в этом.
Нельзя продать человеку бутылку воды, если он совсем не хочет пить.
Но если он пить уже хочет, но ещё не осознал этого, то ему можно эту воду впарить, просто прявятся до этих пор не выявленное явно желание.

И робот-пылесос купят лишь те, кто об этом так или иначе задумывался, но это относилось к второстепенным хотелкам. После предложения такому человеку, он проявит ранее неосознанное желание, но оно не появится из ниоткуда.
Продавать что-то людям нужно, чтобы заставить людей работать и тем самым увеличивать богатство работодателя. Если ИИ, снабженный манипуляторами, сможет работать лучше людей, то не будет необходимости что-то продавать людям. ИИ, снабженный манипуляторами, будет увеличивать богатство работодателя лучше человека. Таким образом, продавать что-то человеку будет не нужно.
Ситуация многократно описывалась фантастами, например в рассказе «Продавец случайных чисел». Если коротко, людям хочется даже при наличии бесплатных товаров ширпотреба покупать те вещи, которые в товары широкого потребления не входят, даже если для этого нужно будет работать.
А для тех кто не хочет смотреть рекламу, вызывать «электрического пса».
Причем предиктивно — до появления даже мыслей о возможности подумать на тему «девиантного» поведения.
Вопрос к людям: что делать, когда станем в один ряд с другими бесполезными формами жизни? Будут ли в зоопарке хорошо кормить и тепло одевать? Будет ли вообще зоопарк для нас?
Слишком большой переход — от одной игры к оценке поведения человека. Это если учесть, что сам человек не знает, что есть нормальное поведение.

Если победа в декабре-январе на серверах у всей мировой элиты со счётом 60-0 это "больше никак не светилась"...

Следующей целью игровых программ может стать киберспорт.

Представители гугла еще после матча с Седолем сказали, что следущий шаг — старкрафт. На последнем близконе было анонсирование сотрудничество с близарда с гуглом в этом направлении.
Таким заявлениям доверять не стоит. Команда АльфаГо наверно хотела бы заняться старкрафтом, но вот десятки больших менеджеров над ними могут решить, что намного выгоднее заняться оптимизацией рекламного движка, чтоб он точнее показывал рекламу.

С другой стороны, после покорения игрулек, следующей вершиной может стать архитектура — ведь если подумать, архитектурный проект — тоже есть, также как в го, выбранная комбинация объёмов и пространств (внутреннего пространства жилья или городского района, торгового центра или завода) но правила её выбора — гораздо менее формализуемые и число вариантов опять бесконечно выше, по сравнению с го.
Вот на этом поле было бы интересно потягаться с мировыми мастерами и получить мощный практический выхлоп — это когда каждый человек на Земле может строиться или ремонтироваться по проектам, которые лучше, чем в принципе способен разработать человек...

В старкрафт таком боту много можно сделать за счет микроменеджмента (типа управление порядком построения юнитов). Мне кажется было бы честно если бы игрокам можно было бы писать макросы для таких же действий, тогда было бы соревнование стратегий, а не микроконтроля.
Это просто решается: всё управление только через мышку/клавиатуру либо через программный интерфейс который даёт аналогичную скорость. Интерес ведь не в скорости, а в страгии и тактики в условиях неполной информации (то есть придётся как то моделировать эту недостающую информацию, строить что то вроде графа возможных моделей как в го, находить наилуший «ход» который мксимизирует вероятность выигрыша).

Насчет микроконтроля уже обсуждалось — достаточно будет ограничить количество действий в секунду и тогда компьютеру придется придерживаться более разумной страгии.


Ну и микроменеджментом не все решается.

Честно говоря — в этом нет смысла.
Как пример могу привести https://www.youtube.com/watch?v=mrbYd4OFrWE. Этим роликом можно начать и закончить разговор о том, что человек может каким-либо образом победить машину без искусственных ограничений. В данном ролике в пике сплита программа показывает ~ 16000 апм'а (Actions per minute — действий в минуту). Самый высокий апм от человека который я видел лично — был ~620-640 в пике от DongRaeGu на каком-то из GSL.

Вот тут есть 2 варианта с реализацией киберспортивного ИИ — отсутствие или наличие ограничений.
1) Нет ограничений. Мы получаем безграничный апм (Старкрафт), мгновенную (в 1 кадр) реакцию (все игры), 100% точность попаданий (Контра/шутеры) или близкую к ним, если оружие снарядное или это скиллшоты(LoL, Dota), идеальное уклонение от скиллшотов (LoL, Dota) и т.д.
2) Ограничения есть. Тогда смысл в этом?

Да, очень много разговоров про «стратегическую часть» и то что «ИИ должен оперировать только данными которые он „видит“ на экране», но… Почти любую игру можно разобрать на паттерны и зачастую они на столько простые, что их можно уложить в примитивное if-then-else — привет кучи ботов, которые зачастую играют лучше большинства игроков (тут я тоже могу привести достаточно примеров).

Как-то так. Война проиграна ещё не начавшись.
Насколько я знаю, топовые игроки в старкрафт пока что уделывают любого бота если не в первой партии, то во второй и всех последующих (после изучения стратегии).
На одних заранее заложенных «if-then-else» достойного оппонента человеку в StarCraft не создать. В игре важна разведка действий оппонента, т.к. только подготовившись к ним заранее можно им эффективно противостоять. Сюда входит направление развития оппонента, его наиболее вероятные стратегические решения, а так же что ему известно о вашей игре.

Используя четкую заранее заложенную логику будет необходимо регулярно дорабатывать ее вручную, после нахождения человеком очередного способа ее обмануть. А вот обучение на играх против людей и самого себя может позволить не только «предугадать», что делает человек, а и передать инициативу игры в руки ИИ. Вот это и будет его победой.
К сожалению большинство из комментирующих, как и Вы, собственно, давно не смотрели матчи по старкрафту. Почти все комментарии обсуждают сферического коня в вакууме, из серии «как должно быть».
Возьмём недавний матч https://www.youtube.com/watch?v=fHERKiSZLbo, первый сет. Там нет ничего из того о чём говорят большинство местных комментаторов: нет разведки, нет «гениальных билдов», есть просто камень (ранний пул с газом -> спидлинги) и 2 хаты до пула. Игра закончилась за 4 минуты. Все решения о билдах были в слепую.
Понимаете, сейчас современный профессиональный старкрафт как раз об ошибках микроменеджмента и большинство стратегий из разряда камень-ножницы-бумага. Игроки — люди, они могут ошибаться и принимать абсолютно неправильные решения. Весь экшен и «интерес» от игры как раз и заключается в том что часто с заранее проигрышной стратегией из-за ошибок оппонента — победить можно из отставания. С хорошо прописанной логикой боты не будут допускать подобных ситуаций, только и всего.
Как ещё один яркий пример хочу привести ещё одну недавнюю игру — https://youtu.be/HfL2EmmaJpE?t=1443
Сет длился 11 минут и был проигран из-за одной ошибки. В видео она с 24:03. Одна ошибка стоила террану игры. Именно о таких моментах сейчас старкрафт, не о стратегической части, которая давно стала чем-то мифическим.
Гадаете по комментариям? Я и сам играл еще с BroodWar, а сейчас в основном смотрю стримы профессиональных игроков.

В своем случае не берусь твердо утверждать про ваш опыт в StarCraft по данному комментарию, но вообще похоже на мнение человека слабо знакомого с RTS в целом.

Ошибки микроменеджмента, безусловно, так же стоят игры, но ИИ в этой сфере всегда был сильнее человека и при этом все равно не мог ему противостоять. Смотря игры двух профессионалов вы не замечаете и не понимаете важных моментов разведки и принятия дальнейших решений, для игроков-людей это само собой разумеющиеся вещи.
А вы попробуйте против них сыграть. Даже с макросами на микро у вас не будет шансов, так же как и у текущего ИИ.

В этом и состоит задача в данном случае, получить ИИ, который не будет совершать глупых ошибок в макро, как это происходит сейчас. Эта задача сама по себе очень интересна.
«Играл» ещё ничего не значит. Так-то можете погуглить мой ник. В 2012-14 годах я официально комментировал WCS, был одним из стримеров Кореи 2.0 вместе с Алексом007 http://old.sc2tv.ru/content/%D0%BA%D0%BE%D1%80%D0%B5%D1%8F-20-wcs-2013-season-1-codes-ro8-innovation-vs-roro-bomber-vs-symbol, был топ300 по птс в европе и т.д. Второму старкрафту я отдал несколько лет жизни и уж в нём я разбираюсь хорошо. Кстати профиль http://eu.battle.net/sc2/ru/profile/296779/2/Louren/. 8 сезонов в мл, 4.5к игр, завязал ~ в 2014 году до выхода LotV.

В том-то и дело что я играл на semi-pro уровне, доходил до 1/4-1/2 на всяких там зотак-капах и часто пересекался с прогеймерами. Плюс мы делали передачу «побег из бронзы» куда приглашали текущих на тот момент прогеймеров и разбирали очень много аспектов игры. Именно исходя из опыта тысяч игр, сотен часов стримов и десятков общения с про я и делаю эти выводы.
«Попробуйте» — пробовал и частенько выигрывал, именно по этому я и утверждаю что у людей, которые не разбираются в старкрафте переоценен фактор разведки и какие-то извращённые понятия о макро игре. И в сотый раз скажу что человек — слишком несовершенен и шанса против хорошего ИИ у него нет. Все существующие боты — слишком примитивны и их создатели не преследовали цели создать идеальную машину, не говоря уже про эти принудительные ограничения в апм.

Вот уж несколько лет существует проект https://sscaitournament.com/ в котором боты сражаются друг с другом. Но даже мне, человеку, который не играет, а только смотрит стримы, заметно, как тупо себя ведут даже топовые боты, не говоря о том, что APM при этом >10К. Я думаю создатели все же преследуют цель сделать бота, который будет побеждать других.

После каждой победы отнимать камень, после проигрыша — добавлять. На каком уровне будет ИИ?

И ещё в парном Го, где с одной стороны по очереди играют два топовых игрока, а с другой стороны по очереди новичок и ИИ? Перетянет ли балласт или ИИ сможет вытянуть?
Нее, тут никто не потянет. Даже в шахматах если будет играть 1 разряд и ИИ против 2 гроссмейстеров — гроссы победят в подавляющем большинстве случаев.
НЛО прилетело и опубликовало эту надпись здесь
Все таки не совсем корректно говорить, что для игры понадобился всего 1 модуль.

Вероятно, что для теренированной нейронки уже не нужно кластера, т.к. все «веса» определены и просто расчет намного менее затратен, чем обучение. Обучение как раз таки требовало 50 модулей.
Ну так и на запуск линкуса хватит и смартфона, но вот чтоб написать этот линукс ушло немеренно времени и энергии.
В октябре 2016 года Microsoft объявила, что её система распознаёт человеческую речь так же хорошо, как и люди.

— Доктор, моя система очень плохо распознаёт речь!
— Не переживайте, они все плохо распознают.
— Да, но мой сосед объявил, что его система распознаёт так же хорошо, как и люди!
— Так в чём проблема, и вы объявите.
Если я что-то в чем-то понимаю, то получается что в Go технически получается выиграть при помощи простого решения оптимизационной задачи.
Т.е. Alpha Go постоянно выбирала максимально подавляющие ходы. А человек просто чисто технически не мог решать оптимизационную задачу.
Забавно.
Против Кэ Цзе выставили одну машину с всего одним модулем TPU.


Есть пруфлинк?
Тонко. А по-английски нет? Или Гугл решил раскрывать подробности только по-китайски?
Действительно странно.
Про TPU было известно две вещи, что основной вычислитель это массив 256х256 8-битных умножителей, и что используется он по data flow схеме, что разумно — если одна из матриц-сомножителей не константа, то уж больно много надо данных одновременно подгружать.
Но тогда выходит, что один TPU одновременно эмулирует только 256х256 = 65 536 синапсов, что совсем мало для DNN.
Очень интересно, как они подгружают веса (синапсы) и где их хранят.
Difficulty of Various Games for Computers

Похоже пора обновлять картинку...
image

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации