Pull to refresh

Comments 132

Психологический пресс снят — всё равно на круг уже проиграл. Играл на расслабоне. Вот и выиграл :)
Да, миллион долларов призовых уже был неактуален, осталось просто получать от игры удовольствие. Впрочем, Седоль так раскачивался над доской во время партии, что создавалось впечатление будто он проигрывает в разгромном стиле.
> создавалось впечатление будто он проигрывает в разгромном стиле.

Блефовал, чтобы ИИ потерял бдительность. Сработало похоже.
Интересно на самом деле, ведь компьютер не подвержен «психологическому стрессу». Как по мне это один из важнейших факторов итогового счёта 3:0 по результатам предыдущих партий.
Сколько раз уже бывало в любом из видов спорта что даже явный фаворит проигрывал, просто потому что «плющит».
А сей раз Седоль просто играл себе в удовольствие и в центре «затащил на расслабоне».
Самое страшное начнётся, когда АльфаГо начнёт играть на расслабоне. После того, как круг уже выиграла… и вправду, чего электроны туда-сюда впустую гонять, когда можно подумать о чём-то более интересном?
Вот тогда противникам курить нервно за углом будет уже поздно.
Всё-таки молодец мистер Ли, после трёх поражений он был разбит и подавлен. А сегодня прям сиял. Не стоило недооценивать противника. Возможно, не проиграй он первую игру, результат серии был бы другим.
Честь Ли Седоля спасена. Послематчевого харакири не будет.

Впервые наблюдал за партией от начала и до конца. Седоль сегодня активно угрожал во всех углах доски (в троих из них отвоевал заметную территорию), возможно, нейросеть ниасилила агрессивную игру сразу на 4 фронтах.

Седоль выиграл благодаря блестящей комбинации в центре доски, когда смог вторгнуться и удержать группу внутри мойо противника. До этого момента можно было сказать, что Ли капитально проигрывал. Ну а потом программа начала гнать откровенную лажу.
Там, судя по всему, проявило себя отсутствие решалки тсумего, что довольно странно, потому что в предыдущей игре Ли замутил очень заковыристую тсумегу в углу зависящую от хитрой последовательности ко, но АльфаГо даже не напрягся.
Интересно, насколько тут важен фактор адаптации человека к игре с конкретной компьютерной системой? Он ведь натренирован играть с другими людьми. Может преимущество человека как раз заключается в том, что он может уже на трёх партиях чему-то новому научиться, а AlphaGo для этого нужно тысячи партий?
Мне кажется, фактор адаптации очень важен. AlphaGo проанализировала тысячи игр людей. Не думаю, что Ли Седоль имел возможность проанализировать массу игр этой системы. Это подтвердится, если он найдет слабину и сможет ей постоянно пользоваться.
Адаптация под людей — это только первый этап обучения системы. Как говорят сами разработчики, основную работу она провела, играя сама с собой.

Насколько я понял, в будущем планируется организовать обучение вообще без человеческих партий. Тогда воможно мы увидем что-то новое. Хотя и в прошедших партиях, программа демонстрировала творческое мышление и делала оригинальные ходы.
Я имел в виду, а адаптировался ли Ли Седоль на работу программой?) Поиск и знание слабостей в стратегии соперника — важная составляющая в поединке.
основную работу она провела, играя сама с собой.

И это минус. При такой игре некоторые ошибки лишь накапливаются.
Я верил! Я верил в него!

Ждём пятую партию. Будет очень интересно, если Седоль повторит успех четвёртой.
Не слишком рано называть этот матч историческим?
Вряд ли рано. Многие издания сравнивают этот матч с матчем между Deep Blue и Каспаровым. Были разве другие случаи такого масштаба, когда чемпиона го три раза подряд обыгрывала компьютерная система?
Нет. Ещё за день до матча большинство было уверено что ИИ не ровня человеку в го, и, может быть. через пару-тройку лет, когда разработчики проанализируют ожидаемое поражение AlphaGo в матче и улучшат игру, компьютерная система сможет показывать что-то интересное.

Матч показал что всё, в плане го ИИ как минимум играет на уровне профи экстра-класса. И уже мало у кого сомнений, что в ближайшем будущем люди не будут иметь шансов против суперкомпьютера и в этой игре.

Шахматы пали лет 10 назад, фактически теперь настал черёд го, считающейся гораздо более сложной в плане программирования стратегии.
Я бы еще добавил, что этот матч — фактически первая игра программы с серьезным соперником (и уже такой результат!). Можно только догадываться, что будет в будущем.
UFO just landed and posted this here
Тут ещё психологический момент. Оптимистично оценивать возможности ИИ = признавать, что люди теряют свои позиции и недалеко то время, когда киберсущества будут нас превосходить во всём. Осознание что мы "устареваем" неприятно, и людишки склонны думать что у них ещё есть порох в пороховницах.
UFO just landed and posted this here
Как раз самое время. Это первый и неожиданный матч в котором была серьёзная борьба. Дальше пойдёт рутина когда люди будут все чаще проигрывать и в конце концов просто не останется шансов на победу.
Сейчас пойдут слухи, что у AlphaGo «скрутили» умение, чтобы уж совсем не позорить игрока.
Такие слухи будут циркулировать в любом случае. Впрочем Google подозревать в переживаниях за репутацию Седоля оснований нет. Счёт 5-0 был бы наиболее предпочтителен для корпорации добра (в плане демонстрации прорывного успеха в области разработки ИИ).

Хассабис после игры слегка нервничал — несколько минут мял какую-то бумажечку-шпаргалку, то сворачивал то разворачивал её. Всё-таки разочарован тем, что его детище не выиграло матч всухую.
Сомневаюсь, что для них 5-0 было бы предпочтительнее. Им самим было важно нащупать слабые места ИИ и это случилось.
Слабые места можно нащупать и без поражений. Матч с Фань Хуэем выявил существенные ошибки программы и для создателей AlphaGo счёт при этом был очень приятен :)
Необходимо упомянуть также то, что Седоль указал на слабость AlphaGo при игре черными. На пресс конференции он попросил у Демиса Хассабиса в последней игре опять играть белыми, на что Хассабис дал согласие. Если Седоль действительно нащупал слабую сторону программы, то в последней игре у Ли есть хорошие шансы на выигрыш.
Всё может быть. У белых изначально компенсация в 7,5 очков, чёрным приходится прилагать усилия по нивелированию этого разрыва. Возможно, в алгоритмах компьютерной системы существуют изъяны и величина китайского коми не уравновешивается правом первого хода.
Если судить по словам разработчиков, то первая ошибка (на 79 ходу) — это ошибка именно value network. AlphaGo некорректно оценивала свою позицию, как выигрышную, вплоть до 87 хода.

А вот дальнейшие «ошибки» это уже видимо следствие алгоритма MCTS и методики обучения. AG проигрывала небольшое количество очков (по оценкам комментатаров в пределах коми) и на столе были возможности отыграть там пару, там пару и может быть в отдаленной концовке удалось бы уравнять, особенно если навязать сложный ко-файт.
Но сети AlphaGo были обучены только на бинарную оценку (победа/поражение), потому уменьшение отставания для нее не было приоритетом (грубо говоря, она не видала разницы между поражением в 20 и в 1 очко). Потому при анализе дерева отдавалось предпочтение ветвям, которые в пределах просчета давали видимые шансы именно на победу.
Для наступления такой победы требовались маловероятные (крайне ошибочные) ответные ходы от Ли Седоля, но алгоритм из-за своей архитектуры отдавал предпочтение таким ветвям перед более безопасными, но не дающими очевидных шансов.
Вот и получился тот набор ошибок AI в конце, когда тот играл «детские» ходы (а по сути в надежде на детскую ошибку оппонента), которые Ли Седоль тут же наказывал.
В твиттере про 78 ход пишут: "Taken a quick look at the logs: AlphaGo gave a probability of <1 in 10000 for Lee's brilliant move 78, so AG found this move very surprising".
Разве это была шутка? Ребята из гугла, вроде бы, согласились.
Он в любом случае должен после белых играть чёрными. Он "попросил" играть чёрными, "так как белыми он уже выиграл". Ребята из гугла "согласились".
В последней игре кто будет играть черными должно было решаться броском монеты.
А где можно глянуть правила на этот счёт? Быстрый гугл не помог.
Перечитал дважды, поправьте если я не правильно понял.
Нигири применяется:
1 В начале серии партий, для определения цвета (Ли и АльфаГо тоже разыгрывали нигири в первую игру), потом цвет чередуется.
2 После достижения счёта 3:3 в чемпионате, игроки снова разыгрвают нигири (я так подозреваю, что для 5 игр было бы 2:2)

Не нашёл по вашей ссылке правила, что бы в последней игре серии разыгрывали нигири в любом случае, пишут про ничью по очкам перед последней игрой.
Я так понимаю, что 3:3 (в нашем случае это 2:2, соответственно) относится к количеству сыграных партий за каждый из цветов, чтобы поставить игроков в одинаковое положение, в последней игре снова разыгрывается нигири.
Я не могу привести вам никакого другого сорса за исключением тонны людей на реддите и хн, которые говорят что это так. Вероятно, это было где-то на стриме, так что если вам интересно, можете поискать.
Так как при счете 3-1 нет смысла играть пятую партию и пятая партия играется если никто не выиграл в предыдущих, то разыгрывать нигири перед последней партией и разыгрывать нигири при равенстве очков это одно и тоже.
У меня возникла пара вопросов.
Комментатор говорил, что развитие alphago позволит найти новые техники и улучшит игру людей. Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?
Alphago будет одинаково отвечать на один и тот же ход или там есть доля случайности? Т.е. можно ли повторить этот матч 1 в 1 и победить не размышляя над ходами?
Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?

Вне сомнения. С помощью компьютерного анализа шлифуются дебютные варианты. Множество прорывов совершено в эндшпильной стадии (вплоть до того, что просчитаны все 6-ти фигурные окончания).

Alphago будет одинаково отвечать на один и тот же ход или там есть доля случайности?

Присутствует доля случайности в виде метода Монте-Карло. Повторение партии 1 в 1 невозможно.
Уже все 7-ми фигурные посчитаны.
Присутствует доля случайности в виде метода Монте-Карло. Повторение партии 1 в 1 невозможно.

Зависит от имплементации ГПСЧ, не? С одним и тем-же сидом, вероятно, партия должна повторяться 1 в 1.
ну и, естественно, нужна та-же версия системы… и тут вполне вероятно, что альфу могут дообучать между партиями…
Вряд ли- там как минимум используется метод Монте-Карло, который привносит элемент случайности.
Комментатор говорил, что развитие alphago позволит найти новые техники и улучшит игру людей. Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?

Я не специалист по шахматам, но вот заслуживающий внимания комментарий на английском:

Any opening is pretty much playable given the right amount of analysis. Moves that were once considered not playable have found new life in painstaking objective analysis.

Многие ходы в дебютах, которые до этого считались слабыми, получили новую жизнь

… Basically, now anyone can prepare for anyone

Раньше существовали более или менее закрытые (например, в СССР) "базы данных" про стили игры известных игроков. Сейчас с помощью AI такую информацию гораздо проще собрать и проанализировать.
Смотря насколько быстро обучается система. В долгосрочной перспективе определенно нет. В этом кстати нет большого отличия от человека (достаточно вспомнить любые случаи из жизни, когда повторяешь одну и ту же ошибку, уже зная о ней).
Я тоже за АльфаГо болел. За ИИ наше будущее. Слава Роботам!
И вы серьёзно рассчитываете, что после этого комментария они вас пощадят?...
Шансов у людей в будущей войне со Скайнетом всё равно нет, единственная надежда на выживание — коллаборационизм :)
Сара Коннор — единственная надежда человечества!
А я всегда считал что будущее за апдейтом человеческого мозга и тела.
Роботы тоже так думают (вспомнил Quake 4 где строгги "улучшали" людей и заставляли воевать за себя).
Один человек сражался с целым дата-центром? Мне кажется, что надо ввести ограничение на потребляемую компьютером мощность. 200 Вт, например.
Ага, и количество нейронов заодно.
/irony
Если подвести к человеку десятки кВт энергии, то играть он от этого лучше не станет. Этот вопрос уже обсуждался.
А если против дата-центра будет играть команда из 1000 человек?
попробуйте сначала согласовать 1000 человек. Это вам не это…
У каждого собственное мнение, видение игры, личный опыт, гордость, стремление к лидерству, тщеславие… Будет не игра, а фарс.
Если я не знаю, как эффективно согласовать 1000 человек в данной игре, то это не значит, что такое невозможно.
Ну вот когда человечество выйдет на новый уровень биологического или технического развития и сумеет объединять или синхронизировать сознания в реалтайм режиме. В текущем варианте даже 10 человек в совместной игре воспроизведут ситуацию из басни Крылова и на выяснение чья идея лучше будет уходить гигантское кол-во времени и внимания.

Актуальней давать игроку больше времени на обдумывание. Практически во всех партиях у Седоля кончалось время и принимать важнейшие решения ему приходилось всего за 1 минуту.
Толпа — не единственный возможный способ организации деятельности большого количества людей.
Обычная демократия? Собрать 1000 игроков А класса в ГО, а дальше за каждый ход или стратегию голосовать

Смысла нет. Даже в топ100 разница между 1 и 100 в 300 эло. При 1000 будет разница от 3600 до 2500 эло.
Есть к слову турниры командные, где ходы обсуждаются, но даже там больше чем 3 человека на команду нет.
Фактически можно взять человек 5-10 самых топовых и чтобы они сами из каждого хода играли и обсуждали варианты, тогда думаю профит будет. Но для этого нужно на партию выделять минимум часов 20. На этом шоу тяжело построить.
UFO just landed and posted this here
Такое количество людей не успеют синхронизироваться не только за игровое время, но и вообще за какое-то приемлемое время. А если время увеличить на порядок, то и компьютер станет глубже считать. Если брать слаженную команду до 10 человек, то может качественно что-то и улучшится.
Ну конечно, а отдел бухгалтеров умнее Эйнштейна.
Если это касается скользких вопросов бухгалтерии, со всеми этими минимизациями налогов и при этом чтобы в тюрьму не сесть — и один толковый бухгалтер может оказаться умнее Эйнштейна.

Эйнштейн гениальный физик. Но сомневаюсь, что он смог бы заменить отдел бухгалтеров.
Вообще-то, математик...
UFO just landed and posted this here
Вот это меня тоже возмущает. Но на мой взгляд надо ввести ограничение какое-то более относящееся к обоим партнерам. Максимальный вес, например. Вики говорит, что самый тяжелый человек весил 635 кг (хотя статью про самых тяжелых игроков в го не искал), вот пусть в эту массу впихивают все. Если во время игры можно есть-пить — компу повезло, топливо для генератора на всю игру можно не учитывать в этом весе. И никаких подсказок со стороны.
Для шоу лучший вариант — будет внимание к пятой партии.
Закидайте меня помидорами, добейте карму, но я думаю это шоу. Слишком драматично, эпично и все дела. Взяли не самого сильного игрока, но самого так понимаю колоритного из лучших. Сначала сделали сенсацию выиграв 3и подряд, теперь, интрига человека выиграл. Причем кто, кому поддается еще неизвестно. Может программа слабее, чем думают, может её ослабили для обострения ситуации, может AlphaGo лишь инструмент, а удаленно с помощью просчетов позиции на кластере играет комманда высокого уровня. А может я параноийю весной схватил. Но вот клянусь моей шапочкой из фольги, маркетологи бы сделали так, 5:0 неинтересно, а вот 3:2 или 4:1 и политически корректно к белковыми, и привлечет их внимание. А может это шоу в стиле смотрите какой гугл молодец. Пойду таблеток выпью, чтоле.
Едва ли. В Азии к го относятся очень серьезно, гроссмейстеров почитают как национальных героев, всякие пафосные титулы им выдумывают. А если посмотреть на проигрывающего Седоля, все мысли о подставе должны сразу отпасть.
Да и гуглу это тоже ни к чему, в конце концов победа робота была вопросом времени, а миллион зелени для него — капля в море.
Когда канадцы проиграли свой домашний ЧМ по хоккею, некоторые тоже говорили, что там все куплено :) Лично слышал своими ушами.
сразу видно человека который мало или вообще не играл против компа. Возьми любой файтинг или стратегию где приходится играть против ИИ. Выбери режим hardcore и получится стандартный расклад для среднестатистического игрока: первые стычки проигрываются вчистую, затем изучение тактики и алгоритмов ИИ и выстраивание контр-стратегии, затем первые удачи и в итоге гарантированные победы с минимальными усилиями. Для игрока который прошёл все эти стадии игра против этого ИИ уже теряет смысл т.к. победа достаётся слишком легко и предсказуема. Так и тут — если Ли Седоль нащупает слабые стороны ИИ, то сможет эффективно их использовать раз за разом. Вопрос только в том что с той стороны сидят программисты которые так же внимательно следят за косяками своего детища и в состоянии подкрутить алгоритм в перерывах между играми. Но в любом случае я бы не удивился результатам в стиле fail — fail — fail — win — win — win
UFO just landed and posted this here
сомневаюсь что на анализе одной единственной партии Alphago сумеет чуть ли не в реальном времени перестроить всю свою стратегию. Так может человек, но не ИИ построенный на современной реализации нейронных сетей.
Пальцем в небо. Как раз имею опыт игры против ИИ в шахматы и за 3и партии выяснить слабые места, так, чтобы вчистую выиграть невозможно, если только изначально его непревосходишь в разы. Го так же игра с полной информацией и здесь фишки как в героях/старкрафте и т.п. где компьютер не знает, что вы там на базе делаете и куда ведете основные силы не прокатят. Если всего за 3и игры Седоль нащупал выигрышную стратегию это говорило бы о слабости ИИ.

Кармы мало, поэтому отвечу здесь и другим. Все эти сказки о том как в Азии чтут Го, что прям сенсей сделает харакири если проиграет, напоминают небылицы, что все русские прям дофига шахматисты времен СССР. Да, у них есть традиция, но ненадо думать, что чм по Го, шахматам или городкам нельзя купить. Что прям в Азии все по чину. Вы еще экскурсоводам поверьте в курортном городке. Коррупция в том же Китае не хуже российской, куда больше, чем в США, за Южную Корею не знаю, но думаю не лучше Западной Европы. Поэтому детскую веру в принципиальных азиатов оставьте там же где жители Сибири ходят в обнимку с медведями, грузины все как один гостепреимные, евреи богатые, а французы донжуаны. Именно интрига выгодна всем, от Ли Седоля до Гугла. Если не понимаете почему так, почитайте те же азиатские тракты типа «Искусства войны».
Ну 3-0 это не интрига. вот было 2-1 тогда была бы интрига сумеет ли чемпион мира обыграть бездушную машину. А потом ещё и 2-2 вообще бы подогрело интерес. А так никакой интриги которая была бы «выгодна всем».
3:0 — нет, а вот 3:1после 3:0 уже интрига. После 4:0 почти все бы интерес потеряли, списав белковых на свалку истории.
А при счете 3:2 общество потребует продолжения игры, интерес сохранится на годы.
Про харакири была шутка, разумеется, высмеивающая как раз стереотипы про азиатов. Тем паче, что харакири, вроде как, не входит в корейскую традицию.
Гугл заинтересован в победе в сухую, и это как раз таки очень эффектно было бы. Поэтому намеренно ослаблять AlphaGo у него точно нет резона.
Мой друг, который очень круто в Го играет говорит, что первая ошибка была на 23 ходу. Это какая-то очень стандартная комбинация, в которой альфа го сыграл как новичок. Потом бот повторил два раза ход из второй партии (на 25 и 47 ходу), который тогда Ли поверг в шок, а теперь Ли уже явно подготовился как против такого играть. Ну и да, потом серия явных ошибок, особенно после большого окружения.
Судя по вашему комментарию, ваш друг не очень круто играет в го. "ход из второй партии" — это стандартный прием, даже название у него есть — "удар в плечо". Его необычность во второй партии в том что он был сделан по отношению к камню стоящему на 4-й линии, к камню на 3-й (как в последней партии) его играют достаточно часто и ничего необычного в этом нет. Между прочим, до хода 78 и последующей комбинации в центре, позиция на доске многими профессионалами оценивалась как благоприятная для белых. Ход E4 (23-й) тоже не выглядит как ошибка, скорее как проверочный ход. Ли Седоль потратил 2 хода чтобы этот камень забрать, мне сложно оценить эту комбинацию, но по моему субъективному мнению не очень крутого игрока (3 дан РФГ), плохим этот ход назвать сложно, и уж точно не тянет это на "игру новичка".
Да, не очень, наверное. 4д на европейском сервере, 6д на китайском и корейском
В России вроде года 3-4 назад дошёл до 2д, потом забросил местные турниры. По рейтенгу РГФ был топ-20 тогда, чемпион Питера.

Я сам играть не умею. Сказанное мной он озвучивал с отсылкой к разбору партии Ли Седоля 9ми данами. Там есть два англоговорящих, один американец, один китаец.
Как-то не сходится все. 2д никогда не мог быть в топ-20 РФГ, этого недостаточно даже чтоб в сотню войти, хоть сейчас, хоть 3-4 года назад. Да и чемпионат Питера 2д вроде не выигрывал на моей памяти. И не могу я поверить, что 4д скажет что E4 это ход новичка (разборы партий я тоже смотрел). Не скажете как вашего друга зовут?
Евгений Дергач его зовут.
Точность формулировок я мог не сохранить, но смысл был примерно такой. Е4 -явный оверплэй, свойственный новичкам, два удара в плечо — ни о чём, причём первый — ошибка Ли что он не ответил агрессивно.
Е4 -явный оверплэй

Спорная формулировка, такой ход в принципе играют, можно подумать над тем, насколько вовремя он был сыгран.

свойственный новичкам

Вот это точно нет. Там есть хорошие продолжения. Если новичек и может сыграть такой ход, то только случайно :)

два удара в плечо — ни о чём

Первый был вполне о чем, и он как раз был связан с продолжениями в углу, для того чтобы сыграть более агрессивный ход в углу, черному потребовалась бы поддержка на стороне. Второй более спорный на мой взгляд, я бы накрывал через пункт сверху в такой позиции, но не мне судить машину, которая мне камней 6 форы дать может :)

Но в текущей формулировке, у меня гораздо меньше желания назвать написанное ерундой.
Ну и да, потом серия явных ошибок, особенно после большого окружения.

Явная ошибка со стороны альфаго была в партии только одна, 97-й ход C4 и произошла она после того как бот "понял" что шансы на выигрыш явно упали. Возможно, что это связано с алгоритмом, который не учитывает величину выигрыша/проигрыша в очках, его единственная цель максимизировать вероятность выигрыша не зависимо от его величины. Думаю что инженерам гугла стоит подумать о том, чтобы в ситуациях, когда бот проигрывает, он менял стратегию и начинал играть на уменьшение отрыва а не на увеличение вероятности выигрыша. Если отрыв в очках сократить, то появляется возможность обыграть человека в концовке.
Мне кажется, цвет нужно было не разыгрывать, а чередовать.
Плюс я бы дал человеку право выбора цвета в первой партии.
Как и в первой и второй играх, Седоль исчерпал время раньше оппонента. То есть в какой-то момент человек был вынужден тратить всего по минуте на ход.

Э… ограничение времени при игре с ИИ? Но ведь это нечестно, разве нет? Может я не понял из-за того, что не играю в го, но звучит очень странно.
Стандартные правила игры в Го, по которым играют оба. А правила проверены временем и ориентированы на физические возможности человека. Без проф подготовки поиграть в Го против равного или более сильного игрока много не получится — уже через 2-3 часа такой игры ощущаешь себя как выжатый лимон и физической усталостью сравнимой с пробежкой в десятки км. Да и растягивали бы эти партии фиг знает как — проигрывающий игрок будет до последнего тянуть при каждом ходе пытаясь найти выход из патовой ситуации…
Да и насчёт честности тут тоже не всё так просто — если дать человеку больше времени, то придётся его же давать и ПК. А это — лишние итерации и возможность дальше просчитать последствия хода. При наличии неограниченного времени ПК даже с самыми примитивными алгоритмами будет иметь 100% шанс победы
Стандартные правила игры в Го, по которым играют оба. А правила проверены временем и ориентированы на физические возможности человека.

Правильно. Человека. Вот он и упёрся в эти ограничения. Для ИИ ограничения должны быть другими.
Хотя для первых игр важна принципиальная победа ИИ.

При наличии неограниченного времени ПК даже с самыми примитивными алгоритмами будет иметь 100% шанс победы

Не согласен. В этом случае скорее вопрос кто кого переживёт. Вроде бы срок службы микросхем пока что меньше продолжительности жизни человека.
(Вспомнилась почему-то притча про Ходжу Насредина. И его фраза. Либо ишак, либо падишах, либо я.)
Правильно. Человека. Вот он и упёрся в эти ограничения. Для ИИ ограничения должны быть другими.

возможно. Но тут уже проблема как высчитать эти ограничения. Для ИИ ограничение времени на ход имеет даже более серьёзные последствия, чем для человека. Человек в конце концов может сделать ход инстинктивно, а вот пк без точных расчётов превращается в дебила. Те же блиц партии с 15ти секундными ходами AlphaGo вряд ли сможет выиграть даже у более слабого противника.

Имхо самый интересный вариант сейчас был бы с партией растянутой на несколько месяцев. Скажем 12 часов днём отдаётся человеку на ход и 12 часов ночью для ПК. Обмен ходами раз в сутки. Это даст максимальную фору обоим участникам и позволит использовать все свои ресурсы и возможности для обоих сторон.
возможно. Но тут уже проблема как высчитать эти ограничения.

Я предлагаю подойти с другой позиции. В каком направлении мы бы хотели видеть развитие техники? И уже отсюда придумывать ограничения. Ведь понятно что какие бы ограничения придуманы не были, их будут пытаться обойти. Так пусть пытаются в той сфере, что даст пользу всей отрасли, а не её отдельному сегменту.
Это касается качественных характеристик, т.е. того — что вообще стоит ограничивать?
А по поводу количественных, т.е. конкретных значений всё проще, мне кажется.
Сейчас же не проводятся регулярные соревнования и вопрос пока ещё не такой острый.
Нужно взять текущее состояние AlphaGo. И с каждым годом уменьшать его, скажем на 10%. Конкретное значение можно брать скажем из среднего прироста в отрасли. Это оставит множество векторов для развития. А если окажется, что этого не достаточно и ИИ выигрывает в 100%, то тогда можно будет подумать над ещё одной качественной характеристикой.
Вообще, этот вопрос сейчас мало актуален, поскольку любое нормальное ограничение урежет возможности ИИ слишком сильно. Здесь мне видится актуальным именно постепенное поступательное изменение/улучшение.

А ваш вариант интересный, согласен. Особенно сейчас, когда человек ещё может победить.
Время хода ограничено. Все правильно. Ведь тогда и ИИ может думать па часу на ход. А так тоже вынужден быстро думать
Э… ограничение времени при игре с ИИ?

Я вот тоже не понимаю.

То есть в какой-то момент человек был вынужден тратить всего по минуте на ход. AlphaGo же хорошо распоряжалась временем — это результат добавления нейросети, которая помогает управлять им.

Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo.

При чём здесь эффективность нейросети, если используется огромнейший кластер? Если производительность по времени будет недостаточной, то, насколько я понимаю, мощность можно увеличить. И делать так дотех пор, пока скорость не станет приемлемой.
Да, нейросеть вещь необходимая. Но именно мощность вычислений ничто (кроме денег) не мешает нарастить другим путём.
У человека же мощность, в силу биологических причин, пока что, нарастить не представляется возможным.

Должно быть какое-то ограничение. А то так (условно конечно) все сервера гугла можно на ограниченное время подключить к расчётам, а потом удивляться, что эта система принимает решение быстрее человека.
Да, победа без ограничений это важный шаг. Можно сказать, принципиальный. И теперь вопрос лишь в мощности. А значит, что пора придумывать ограничения.

Да, я уже видел ветку с ограничением по мощности. Забавно. Если такое примут, то будет развиваться энерго-эффективность. Но принять такое ограничение для всег кластера… мне кажется не реально. Но согласен, к этому можно стремиться.
Есть ещё идея, на будущее. ИИ должен присутствовать на состязании целиком. И успевать "сесть за стол" за то же время, что и человек. Опять же, прямо сейчас это не реально.

В будущем, мне кажется было бы не плохо постепенно вводить эти ограничения. В таком случае, мы получим прогресс в миниатюризации энерго эффективности. Уже сейчас можно начать, установив текущие мощности AlphaGo как максимальную планку. И договорившись понижать е каждый год. Причём даже не важно насколько.
Можно даже забить на всё это и придумать нечно иное. Но миниатюризация и энерго эффективность мне кажутся более предпочтительными. Что насчёт иметь своего персонального AlphaGo на телефоне или умных часах и не переживать по поводу батареи?
Для начала, мне кажется, DeepMind и Google будут решать проблему самого ИИ в том или ином виде.

А проблема энерго-эффективности — она решается на уровне самого гугла. Скажем DeepMind добавят что-то в поисковый движок, и команда гугла будет работать над оптимизацией. Т.е. энерго-эффективность только тогда, когда алгоритм интенсивно работает над real world problem.
Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo

И какую же именно информацию они гоняли от доски до дата-центра что им потребовался отдельная оптика? Просто перестраховались за связь вообще, а написали так, как будто там видео-стримингом занимались. По сути там и мобильного Edge много было бы )
Так и представляю, как сегодня ночью перед следующей игрой, Альфа Го будет посылать армии друг на друга, эмулируя проигранную игру снова и снова, а какой-то внутренний процесс подкрепления с плёткой будет приговаривать "Не делай больше таких глупых ошибок".
Справедливости ради стоит отметить, что этого не происходит. Разработчики уже заявляли, что между партиями программу не модифицируют и в процессе никаких рычагов воздействия не имеют. Видимо посчитали, что так будет интереснее.
А самообучени в процессе игры происходит?
Одна игра ни на что повлиять не может, скорее всего.
Чтобы обучаться на текущих ходах, надо знать их реальный исход. Если партия была выиграна, то сети накидывается поощрение, ход за ходом.

Подозреваю, что в течение партии этого не делают, ибо на руках у машины будет только оценка вероятности успешного исхода партии из заданной позиции, ну и прикидки монте-карло, которые тоже могут быть необъективными (как показала нам 4 партия).
Ну ИИ называют по традиции с машинным противником. Он ведь построен на нейронной сети, то есть такая "китайская комната" натренированная делать определенные ходы в определенных ситуациях. Поэтому с таким подходом можно любую логическую игру выйграть, главное грамотно описать
Утверждается, что люди будут всегда называть ИИ систему, способную решать множетсво задач, которые еще не решены текущим ИИ, а все, что решает текущий ИИ, называть не настоящим ИИ: о)

Ваш мозг тоже построен на нейронной сети, то есть это тоже такая "китайская комната" натренированная на какие-то базовые задачи, многие из которых более тривиальны, чем игра в го. В частности, она пока у вас плохо научена правильно писать слово "выиграть".

Система признаёт поражение, когда оценка шанса победы падает ниже 20 процентов

Это не верно, согласно этой статьи: https://habrahabr.ru/post/279071

AlphaGo сдается, если у всех ходов Q-score < -0.8, т.е. вероятность выиграть меньше 10%.


Интересно, что в октябре Фань Хуэй тоже выигрывал у AlphaGo, но только в одной из пяти неформальных игр.

это тоже не верно, он выиграл в двух из пяти, и там было важное ограничение — 30 секунд на ход: https://gogameguru.com/go-commentary-deepmind-alphago-vs-fan-hui-game-5

He won two unofficial games against AlphaGo (30 seconds per move), but lost all the official games.
Удивила логика программы. Есть вероятность выиграть, хоть и 20%, а она сдается. Такое может быть обоснованно при экономии облачных мощностей. Но на этапе обучения мощности требовались выше, чем при игре, так что вариант отпадает.
Мне, наоборот, это кажется логичным, ведь если твой противник в данной конкретной игре смог снизить твои шансы до 20% (выше упоминалось 10%), то в данный момент он сильнее и нужно ждать откровенной ошибки с его стороны, чтобы изменить ситуацию, а тут, насколько я понимаю, еще появляется лимит по времени.
UFO just landed and posted this here
UFO just landed and posted this here
Это заложено намеренно для сохранения культуры поединка, чтобы не получалось, что машина продолжает играть, хотя проигрыш уже очевиден.
UFO just landed and posted this here
Да и в шахматных поединках (если это солидное соревнование, а не во дворе на лавочке играют) тоже не играют до мата включительно.

Если тянуть до последнего, тот тут одно из двух. Или надеешься что соперник грубо ошибётся и своим нелепым ходом даст шанс. Это полнейшее неуважение к сопернику, особенно если это игрок высшей категории. Как будто надеешься, что перед тобой на самом деле не гроссмейстер, а какой-то дурачок.

Или же речь о том что противник в цейтноте, израсходовал своё время и вот-вот на его часах упадёт флажок. Тогда вполне корректно продолжать игру. Однако в го обычно контроль времени, в котором цейтнота как такового практически возникнуть не может. В худшем случае у противника 1 минута на 1 ход. Для игрока уровня Седоля это абсолютно достаточно, чтобы спокойно закрепить победу.
Кроме того в го аналога мата нет. По окончанию игры подсчитываются очки.

Если в шахматах часто есть призрачный шанс подловить соперника на внезапную комбинацию, то го это игра в которой столь внезапные повороты в заключительной стадии партии практически исключены. В конце партии игроки пожинают плоды своей терпеливой стратегии, если у кого-то очевидный выигрыш, то надеяться на чудо не приходится — таковы особенности игры.
10% шанс на победу это далеко не очевидный проигрыш.
Смотря что за игра. В шахматах одна удачная комбинация может всё перевернуть с ног на голову. В го совершенной другой характер игры, если преимущество опытного противника достаточно большое, то на спасение шансов практически нет.
то на спасение шансов практически нет.

Тогда это и не шанс 10%. Шанс 10% — это достаточно ортогональная типу игры вещь, которая говорит, что если бы мы сейчас вселенную форкнули раз так миллион, то в 100К вселенных мы бы выиграли. Учитывая специфику го, это на деле должно обозначать достаточно близкую позицию с незначительным перевесом.
Насколько я понимаю из объяснений по поводу того как AlphaGo с помощью метода Монте-Карло ищет оптимальный новый ход, то могу предположить по поводу упомянутых 10-20% примерно следующее:

Из возможных условно случайных продолжений игры, в 10% вариантов преимущество у компьютера, 90% — у человека. Но это отнюдь не значит, что на практике вероятность того что, что реальная игра с вероятностью 10-20% пойдёт по пути из этих 10-20%, найденных с помощью метода Монте-Карло. Так как противник-человек пользуется не методом Монте-Карло, а просто идёт по очевидно выигрышному пути, то выигрышные для него "монтекарловские" 90% в реальности — это больше 99%.
Sign up to leave a comment.

Articles