All streams
Search
Write a publication
Pull to refresh
143
0
Виталик Гордон @alex_blank

незаслуженный народный артист™

Send message
Основная проблема криптовалют — волатильность…

Есть же DAI — децентрализованный стейблкоин построенный на смарт-контрактах Ethereum. Курс всегда равен примерно доллару и колеблется незначительно. Это кстати опровергает тезис автора о том, что смарт-контракты только для бессмысленных ICO якобы можно использовать.


Такой токен вполне можно использовать как платежное средство. Для магазинов это было бы удобно, потому что в отличие от расчетов по картам тут невозможны refund'ы. Насколько мне известно риски refund'а закладываются в стоимость товара. Поэтому в случае оплаты DAI можно было бы делать покупателю скидку, стимулируя оплату именно через это средство. Правда, неизвестно насколько это законно, но это уже другой вопрос.


https://makerdao.com/en/

и дает команду нужному набору своих юнитов на атаку нужного юнита соперника (а остальные юниты ИИ в это время атакуют другого юнита соперника). Человек никак не сможет сделать такой расчет моментально во время битвы.

В общем apm, конечно, важен, но в данном случае это далеко не главное.

Почему же не главное? Ведь если бота заставить выделять юниты как человека — курсором мыши (с сопутствующими ограничениями), а не моментально, то такой расчет совершенно обессмыслится, так как если бот в горячке битвы будет пытаться выделять огромные количества нужных юнитов для «оптимального фокуса», то проиграет битву, потому что для такого выделения нужно будет потратить огромное количество действий и времени на это самое выделение. При ограниченном APM оптимальным стилем контроля будет примерно то, что сейчас делают люди — заранее продумывать группы и грамотно разводить войско в пространстве.


То есть, демонстрируемый стиль микроконтроля бота возможен только при отсутствии ограничений на необходимость двигать курсором и нажимать кнопки на (виртуальной) клаве. А это уже совсем другая игра получается — не такая, в которую играют люди.

Бот играет в рамках правил которые установили Близы (тулкит для ботов они выпустили официально), спортсмены играют в рамках тех правил которые установили те же Близы

Если вы будете демонстрировать такой микроконтроль на ladder, на вас нажалуются и забанят за читы (на ютубе полно видео таких читеров). Поэтому бот как раз играет не по правилам. Правила это не «то, что позволяет делать API», это несколько больше. Просто на уровне API нет было смысла вводить дополнительные ограничения, которые и так продиктованы мышечно-моторными возможностями человека. Игра сбалансирована под эти неявные моторные ограничения, они являются частью правил. Абилки разных юнитов, их характеристики — все это тонко настроено именно под то, что вы управляете игрой через мышцы, мышь и клавиатуру.


Если я буду играть в против вас и мой APM будет выше — исгра сразу станет нечестной?

Если ваш APM будет выше того, что могут в принципе делать люди — то да, она сразу станет нечестной и вас забанят. Это происходит постоянно, кстати. Дело в том, что если ваш APM слишком высок, то никакие «оригинальные билды» оппоненту не помогут выиграть, вы можете задавить его тупо механикой в 100% случаев, если у вас есть хотя бы минимальное понимание игры.


у кого-то микро лучше, у кого-то хуже, зато вытаскивает на понимании игры и оригинальных билдах

Прекрасно, значит пусть бот «вытащит» на понимании игры и оригинальных билдах. Сделаем ему эффективный APM даже чуть ниже чем у человека, чтобы ни у кого не было сомнений, что дело не в моторных преимуществах!


А если бот не сможет победить в таких раскладах — значит, не очень-то он и интеллектуален. А ведь именно это мы и пытаемся выяснить — есть там превосходящий человека интеллект или нет.

Ну да, эта проверка, эта демонстрация не показала, что AI может обыграть человека, играя на равных. Ну и что.

Проблема не в этом, а в том, что и сами DeepMind и журналисты в интернетах поспешно презентуют это именно как безусловную победу AI при игре на равных, а не как лишь предварительный результат при большой форе у AI. Проблема в несоответствии заявляемого и действительного. Это fraud, фальсификация, введение в заблуждение, «эксперимент поставленный нечистыми руками».


То есть, никто не умаляет заслуги DeepMind в том что они смогли представить первого бота который хоть как-то смог обыграть человека в SC, но то как это было подано — это вызывает возмущение.


Такие вещи (поспешная презентация достижений которых еще нет) происходят нередко, и очень вредят науке и прогрессу. Потому что теперь все будут считать что задача уже решена, хотя она еще не решена. И если завтра кто-то сделает более «трушный» AI для SC, никому до этого уже не будет дела, мол, «мы это уже видели». Собственно, это и демотивирует даже пытаться делать это, потому что кто-то уже получил лавры (пусть и незаслуженно) за решение этой проблемы.


DeepMind следовало бы признать свою ошибку и выступить с публичными разъяснениями. Если они этого не сделают, я глубоко разочаруюсь в их команде.

Только в тех ситуациях, когда APM больше «не на что» было потратить эффективно, т.е. не в моментах интенсивных стычек. Этому AI научился у людей, так как первую версию обучали на реплеях, перед тем как она начала играть сама с собой. Но поскольку это не влияло на винрейт, ИИ «не смог забыть» эту привычку. А вот в критические моменты он тратил свой APM очень эффективно, так как это влияло на винрейт при обучении.

Этот график — профанация и притягивание за уши… Какой нафиг APM в 2000 у человека, и какая разница какой APM «средний» если важно то, какой он пиковый в критические моменты игры, и какой процент полезных действий в этом APM, ведь большая часть человеческого APM это спам-клики и перемещение камеры, при том что боту же даже камеру перемещать не надо было.


Вот очень хороший пост в /r/MachineLearning где все четко расставляют по полочкам:


An analysis on how AlphaStar's superhuman speed is a band-aid fix for the limitations of imitation learning


> Поэтому возможно в 2-3 раза выше эффективный апм,


Но в Старкрафте это гигантское преимущество и полностью меняет игру, при в 2-3 раза большем APM чем у топовых прогеймеров, оптимальным стилем игры становится массить блинк сталкеров и давить ими c трех сторон одновременно. В Старкрафте в балансе многое рассчитано на то, что идеальный контроль у человека невозможен, и баланс старкрафта во многом про искусство эффективного менеджмента ограниченного количества действий в секунду. Если его не ограничивать, то игра просто теряет смысл.

Потому что со всем остальным (кроме бешеного APM) у тех ботов было совсем плохо, они были слишком «запрограммированные» и негибкие, что позволяло легко найти брешь в их алгоритме и нагнуть их.


Но при наличии минимального интеллекта у игрока (что DeepMind вполне себе демонстрирует), сверхчеловеческое микро уже не «контрится» — тонкий игровой баланс Старкрафта на такое просто не рассчитан.

Вот что сам MaNa пишет на реддите, когда его спросили, чем бот был лучше/хуже человека:


I would say that clearly the best aspect of its game is the unit control. In all of the games when we had a similar unit count, AlphaStar came victorious. The worst aspect from the few games that we were able to play was its stubbornness to tech up. It was so convinced to win with basic units that it barely made anything else and eventually in the exhibition match that did not work out. There weren’t many crucial decision making moments so I would say its mechanics were the reason for victory.

То есть, бот тупо рашил базовыми юнитами не особо заботясь о стратегии, и это работало. В этом нет никакой особой интеллектуальности, тупо победа за счет лучшей механики микроконтроля.


Это как называть бота в Counter-Strike прорывом в ИИ и скачком вперёд, потому что он хедшоты делает со 100% точностью. "The goal is to create artificial intelligence, not artificial aiming"

Просто если бы они выставили адекватное ограничение APM (думаю они пытались), то игроки-люди разделали бы бота под орех, и никакой красивой презентации для инвесторов не вышло бы. А у них дедлайны, надо что-то показать.


Вот тут AMA на reddit с разработчиками, и там выясняется что лимитер APM был настроен так, что даже (теоретически) допускались кратковременные burst'ы под 2500 APM (на практике мы видели 1500 в боях), что конечно полный бред, ни один человек никогда так не сможет кликать — чисто физически эффективный APM не может быть выше 200-300, все что выше это бессмысленные «раскликивания», возможно даже с помощью макросов клавиатурных. Причем бот кликает с суперточностью, ему не надо рамкой выделять юнитов и елозить курсором, он может суперточно выбрать любой набор юнитов в любых местах карты одновременно — ему даже и камерой не нужно было елозить, он играл с «зумхаком» все игры кроме последней (где он позорно слился). Это профанация полная, рассчитанная то чтобы впечатлить и убедить тех, кто в SC никогда не играл. Манипулирование числами и статистикой (это я про их «средний APM даже ниже чем у игроков-людей» и красивые графики распределений, где сравниваются яблоки и апельсины).

Во-первых, в ключевых сражениях APM достигал 1500, поэтому не столь важно какой APM «в среднем». Ведь исход игры решается именно в эти пиковые моменты стычек.


Во-вторых, за счет того что ему не надо было двигать камеру и курсор, он мог очень эффективно «расходовать» свой «не слишком большой» APM, одновременно микря в трех местах карты и супер-точно управляя отдельными юнитами, и не забывая раскачивать экономику и производство — что человек делать не в состоянии, поэтому и в макро у человека естественно тоже будет серьезное отставание.


Очевидно что некорректно сравнивать человека и машину в том ключе где у машины чисто механическое преимущество. Последняя игра, где «мапхак» был пофикшен, была довольно показательна — но этого мало, нужно еще лимитировать скорость и точность контроля, потому что баланс SC не рассчитан на сверхчеловеческие возможности микро.


игр за 10 дней и будет строить Фениксов и не будет тупить Сталкерами.

Я в этом не уверен, может и будет, а может и нет. Я обратил внимание что AI например не пользуется форсфилдами — видать, за 200 лет игр сам с собой так и не научился? А чему еще он не научился? Как по мне, нужно намного больше игр с разными игроками-людьми, и в более равных условиях, чтобы адекватно судить.

Если задача в том, чтобы впечатлить инвесторов, то они с ней, вероятно, справились. Если задача в том чтобы продемонстрировать deep mind, то пока что нет.


Надо все же отдать должное DeepMind — ранние боты для SC даже при идеальном микро не могли человека победить. Но это потому что они были имбецилами во всем остальном, а этот по общему уровню уже вполне тянет на игрока-любителя. Но пропасть между любителем и настоящим «про» довольно большая — и пока неясно, количественная она (т.е. решается большим количеством TPU и временем обучения) или все же качественная, требующая других подходов к моделированию. И мои опасения заключаются в том, что у DeepMind, вероятно, нет задачи это выяснять...

Творчество рождается в ограничениях.


У человека тоже есть эти ограничения, более того, эти ограничения являются частью правил игры — как соревновательной дисциплины. Люди играют в SC через мышку и клавиатуру, курсор, группы и перемещение камеры — и ваше взаимодействие с игровыми объектами ограничено этим интерфейсом, и это является частью правил игры. Если вы обойдете эти правила, то это будет чит. Быстро думать это не чит, но взаимодействовать с игрой так, как не могут люди — это чит, и за это человека бы дисквалифицировали с любого соревнования, как читера. Я поясню почему, если непонятно.


Это возможно неочевидно тем, кто сам не играет в Старкрафт — но эта игра так устроена, что если получить преимущество в виде возможности делать то, что не позволяет вышеописанный интерфейс взаимодействия — к примеру, если заполучить возможность перемещать камеру или курсор с бесконечной скоростью, то игра «выхолащивается» до примитивной механики, где не обладая никаким особым интеллектом можно победить самого топового игрока, не имеющего такого преимущества. Это очень хорошо видно было когда ИИ на идеальном микро одними сталкерами без единой потери вынес аналогичный лимит имморталов — тогда как при равном микро (уровня человеческой GM лиги, но не сверх этого) исход должен был быть ровно обратным, так как иммортал это контр-юнит к сталкеру. Следовательно, допуская такое, мы переводим игру из плоскости стратегии в примитивную механику — ведь зачем придумывать какие-то стратегии, если можно просто рашить сталкерами и это будет работать в 100% случаев? Но в этом глубины интеллекта не больше чем в ботах Counter-Strike которые мочат моментальные хедшоты с любого расстояния.


Мало формально победить человека в SC — нужно сделать это правильно, чтобы продемонстрировать, что ИИ действительно лучше человека на его поле.


Пока что ИИ в SC демонстрирует игру уровня довольно посредственных игроков, но со сверхчеловеческим микро, что к сожалению дает повод думать некоторым, что это делает его лучше людей — но это не так, это профанация.


Мне это напоминает игроков на ladder которые «катают» один и тот же тайминговый пуш, оптимизируя точность контроля в его рамках — и это работает пока не упрешься в потолок человеческих возможностей контроля (уровня про игроков), и дальше уже невозможно побеждать за счет этого, так как твой противник умеет в микроконтроль не хуже тебя, и начинаются интересные долгие игры с огромным пространством возможных исходов игры, с разнообразными mind games (типа показать противнику одно, а самому сделать другое) или mind games в квадрате, когда твой противник достаточно умен чтобы понять что ты можешь блефовать и так далее. Вот тут начинается настоящая игра, которую ждут от DeepMind, и пока такой не было продемонстрировано.


Мне неприятно читать что в блоге DeepMind пишут:


These results suggest that AlphaStar’s success against MaNa and TLO was in fact due to superior macro and micro-strategic decision-making, rather than superior click-rate, faster reaction times, or the raw interface.

Такое ощущение что это все было устроено чтобы они могли отчитаться перед инвесторами, мол «да победили людей, несите нам бабло и военные контракты скорее». И дальше они просто забьют на SC, так как мол уже все доказали, вот смотрите, топовые игроки сливают же.


Интересно было бы посмотреть, как DeepMind будет выигрывать людей если зарезать APM ему вообще до уровня среднего игрока из какой-нить мастерлиги. И если он сможет выигрывать людей при таких раскладах за счет чего-то ещё — это будет 100% интересно и прорыв, т.к. ему останется побеждать только за счет оригинальных решений, изобретать что-то новое, творчество проявлять (благо StarCraft дает гигантское пространство для таких возможностей). А это как раз и есть то, чего ждут от ИИ.

кстати, зачем он такой большой

По двум связанным причинам:


  1. Если штраф будет маленький, то атака на протокол станет дешевой. Штраф наоборот надо делать максимально возможным, чтобы сделать протокол максимально безопасным. Какой смысл делать протокол менее безопасным, чем возможно?
  2. «Честные» участники системы все равно ни при каких условиях не будут вести себя как злоумышленники, это исключено. Если узел системы проголосовал за конфликтующие версии истории — это злоумышленник и его нет смысла штрафовать «на чуть-чуть».

32 ETH по нынешним ценам это всего около 5 тысяч, но это не так важно. Это залог, который создаёт экономически-обусловленную гарантию того, что вы будете вести себя согласно протоколу. Если за валидатором будет замечено что он действует не по протоколу (например, с вредоносными целями) то его депозит в 32 ETH будет уничтожен (это называется slashing). Это делает атаку на протокол экономически невыгодной, так как потребуется извести гигантское количество средств чтобы провести успешную атаку. Затем и нужны эти «имущественные цензы». Собственно, это краеугольный камень всего Casper PoS, без этого его работа была бы невозможна.

Что значит «неправда»?! Вот ссылка на актуальную спецификацию Ethereum 2.0 которая уже вовсю находится в реализации минимум пятью разными независимыми командами разработчиков:


https://github.com/ethereum/eth2.0-specs/blob/master/specs/core/0_beacon-chain.md


Validator — a participant in the Casper/sharding consensus system. You can become one by depositing 32 ETH into the Casper mechanism.

Это не «возможно будет сделано», это уже делается, и решение о 32 ETH было принято давно, еще когда они отказались от Casper FFG и решили делать сразу PoS + Sharding.

По его задумке получать деньги при выпуске смогут только те, у кого на счету больше 1500 монет эфира, что по сегодняшнему курсу составляет примерно 200 000$ (и это после обвала курса эфириума на 90% !).

У вас сильно устаревшая информация, в актуальной спецификации достаточно иметь всего 32 ETH для staking.

«Демократия это не власть большинства, а защита меньшинств» (Альбер Камю)

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity