atomlib Mar 13 2016 at 13:16

Ли Седоль выиграл четвёртую игру у системы AlphaGo

3 min

22K

Artificial IntelligenceLogic gamesIT-companies

+30

132

Comments 132

isotoxin Mar 13 2016 at 13:23

Психологический пресс снят — всё равно на круг уже проиграл. Играл на расслабоне. Вот и выиграл :)

+12

valemak Mar 13 2016 at 13:34

Да, миллион долларов призовых уже был неактуален, осталось просто получать от игры удовольствие. Впрочем, Седоль так раскачивался над доской во время партии, что создавалось впечатление будто он проигрывает в разгромном стиле.

kranky Mar 13 2016 at 19:54

> создавалось впечатление будто он проигрывает в разгромном стиле.

Блефовал, чтобы ИИ потерял бдительность. Сработало похоже.

+12

ghostinushanka Mar 14 2016 at 04:40

Интересно на самом деле, ведь компьютер не подвержен «психологическому стрессу». Как по мне это один из важнейших факторов итогового счёта 3:0 по результатам предыдущих партий.
Сколько раз уже бывало в любом из видов спорта что даже явный фаворит проигрывал, просто потому что «плющит».
А сей раз Седоль просто играл себе в удовольствие и в центре «затащил на расслабоне».

Vlad_Hm Mar 14 2016 at 09:09

Самое страшное начнётся, когда АльфаГо начнёт играть на расслабоне. После того, как круг уже выиграла… и вправду, чего электроны туда-сюда впустую гонять, когда можно подумать о чём-то более интересном?
Вот тогда противникам курить нервно за углом будет уже поздно.

idziev Mar 13 2016 at 13:26

Всё-таки молодец мистер Ли, после трёх поражений он был разбит и подавлен. А сегодня прям сиял. Не стоило недооценивать противника. Возможно, не проиграй он первую игру, результат серии был бы другим.

+15

valemak Mar 13 2016 at 13:26

Честь Ли Седоля спасена. ~~Послематчевого харакири не будет.~~

Впервые наблюдал за партией от начала и до конца. Седоль сегодня активно угрожал во всех углах доски (в троих из них отвоевал заметную территорию), возможно, нейросеть ниасилила агрессивную игру сразу на 4 фронтах.

Halt Mar 13 2016 at 18:13

Седоль выиграл благодаря блестящей комбинации в центре доски, когда смог вторгнуться и удержать группу внутри мойо противника. До этого момента можно было сказать, что Ли капитально проигрывал. Ну а потом программа начала гнать откровенную лажу.

ankh1989 Mar 14 2016 at 07:40

Там, судя по всему, проявило себя отсутствие решалки тсумего, что довольно странно, потому что в предыдущей игре Ли замутил очень заковыристую тсумегу в углу зависящую от хитрой последовательности ко, но АльфаГо даже не напрягся.

nikolaynag Mar 13 2016 at 13:35

Интересно, насколько тут важен фактор адаптации человека к игре с конкретной компьютерной системой? Он ведь натренирован играть с другими людьми. Может преимущество человека как раз заключается в том, что он может уже на трёх партиях чему-то новому научиться, а AlphaGo для этого нужно тысячи партий?

+10

lexore Mar 13 2016 at 16:35

Мне кажется, фактор адаптации очень важен. AlphaGo проанализировала тысячи игр людей. Не думаю, что Ли Седоль имел возможность проанализировать массу игр этой системы. Это подтвердится, если он найдет слабину и сможет ей постоянно пользоваться.

Halt Mar 13 2016 at 18:16

Адаптация под людей — это только первый этап обучения системы. Как говорят сами разработчики, основную работу она провела, играя сама с собой.

Насколько я понял, в будущем планируется организовать обучение вообще без человеческих партий. Тогда воможно мы увидем что-то новое. Хотя и в прошедших партиях, программа демонстрировала творческое мышление и делала оригинальные ходы.

lexore Mar 13 2016 at 18:18

Я имел в виду, а адаптировался ли Ли Седоль на работу программой?) Поиск и знание слабостей в стратегии соперника — важная составляющая в поединке.

Hellsy22 Mar 14 2016 at 08:43

основную работу она провела, играя сама с собой.

И это минус. При такой игре некоторые ошибки лишь накапливаются.

ivansychev Mar 13 2016 at 13:46

Я верил! Я верил в него!

Ждём пятую партию. Будет очень интересно, если Седоль повторит успех четвёртой.

Jamdaze Mar 13 2016 at 13:50

Не слишком рано называть этот матч историческим?

atomlib Mar 13 2016 at 13:53

Вряд ли рано. Многие издания сравнивают этот матч с матчем между Deep Blue и Каспаровым. Были разве другие случаи такого масштаба, когда чемпиона го три раза подряд обыгрывала компьютерная система?

+14

stranger777 Mar 15 2016 at 15:13

Седоль не чемпион, увы и ах, хотя сильный профессионал. Пятый в Корейском рейтинге:
http://english.baduk.or.kr/sub03_02.htm?menu=f13&divL=2

valemak Mar 13 2016 at 13:59

Нет. Ещё за день до матча большинство было уверено что ИИ не ровня человеку в го, и, может быть. через пару-тройку лет, когда разработчики проанализируют ожидаемое поражение AlphaGo в матче и улучшат игру, компьютерная система сможет показывать что-то интересное.

Матч показал что всё, в плане го ИИ как минимум играет на уровне профи экстра-класса. И уже мало у кого сомнений, что в ближайшем будущем люди не будут иметь шансов против суперкомпьютера и в этой игре.

Шахматы пали лет 10 назад, фактически теперь настал черёд го, считающейся гораздо более сложной в плане программирования стратегии.

Halt Mar 13 2016 at 18:18

Я бы еще добавил, что этот матч — фактически первая игра программы с серьезным соперником (и уже такой результат!). Можно только догадываться, что будет в будущем.

UFO just landed and posted this here

valemak Mar 14 2016 at 12:11

Тут ещё психологический момент. Оптимистично оценивать возможности ИИ = признавать, что люди теряют свои позиции и недалеко то время, когда киберсущества будут нас превосходить во всём. Осознание что мы "устареваем" неприятно, и людишки склонны думать что у них ещё есть порох в пороховницах.

UFO just landed and posted this here

Welran Mar 14 2016 at 06:38

Как раз самое время. Это первый и неожиданный матч в котором была серьёзная борьба. Дальше пойдёт рутина когда люди будут все чаще проигрывать и в конце концов просто не останется шансов на победу.

Barafu Mar 13 2016 at 13:54

Сейчас пойдут слухи, что у AlphaGo «скрутили» умение, чтобы уж совсем не позорить игрока.

-2

valemak Mar 13 2016 at 14:25

Такие слухи будут циркулировать в любом случае. Впрочем Google подозревать в переживаниях за репутацию Седоля оснований нет. Счёт 5-0 был бы наиболее предпочтителен для корпорации добра (в плане демонстрации прорывного успеха в области разработки ИИ).

Хассабис после игры слегка нервничал — несколько минут мял какую-то бумажечку-шпаргалку, то сворачивал то разворачивал её. Всё-таки разочарован тем, что его детище не выиграло матч всухую.

artemerschow Mar 13 2016 at 15:38

Сомневаюсь, что для них 5-0 было бы предпочтительнее. Им самим было важно нащупать слабые места ИИ и это случилось.

valemak Mar 13 2016 at 15:52

Слабые места можно нащупать и без поражений. Матч с Фань Хуэем выявил существенные ошибки программы и для создателей AlphaGo счёт при этом был очень приятен :)

agzamovr Mar 13 2016 at 13:55

Необходимо упомянуть также то, что Седоль указал на слабость AlphaGo при игре черными. На пресс конференции он попросил у Демиса Хассабиса в последней игре опять играть белыми, на что Хассабис дал согласие. Если Седоль действительно нащупал слабую сторону программы, то в последней игре у Ли есть хорошие шансы на выигрыш.

valemak Mar 13 2016 at 14:06

Всё может быть. У белых изначально компенсация в 7,5 очков, чёрным приходится прилагать усилия по нивелированию этого разрыва. Возможно, в алгоритмах компьютерной системы существуют изъяны и величина китайского коми не уравновешивается правом первого хода.

flashtech Mar 13 2016 at 14:38

Если судить по словам разработчиков, то первая ошибка (на 79 ходу) — это ошибка именно value network. AlphaGo некорректно оценивала свою позицию, как выигрышную, вплоть до 87 хода.

А вот дальнейшие «ошибки» это уже видимо следствие алгоритма MCTS и методики обучения. AG проигрывала небольшое количество очков (по оценкам комментатаров в пределах коми) и на столе были возможности отыграть там пару, там пару и может быть в отдаленной концовке удалось бы уравнять, особенно если навязать сложный ко-файт.
Но сети AlphaGo были обучены только на бинарную оценку (победа/поражение), потому уменьшение отставания для нее не было приоритетом (грубо говоря, она не видала разницы между поражением в 20 и в 1 очко). Потому при анализе дерева отдавалось предпочтение ветвям, которые в пределах просчета давали видимые шансы именно на победу.
Для наступления такой победы требовались маловероятные (крайне ошибочные) ответные ходы от Ли Седоля, но алгоритм из-за своей архитектуры отдавал предпочтение таким ветвям перед более безопасными, но не дающими очевидных шансов.
Вот и получился тот набор ошибок AI в конце, когда тот играл «детские» ходы (а по сути в надежде на детскую ошибку оппонента), которые Ли Седоль тут же наказывал.

+23

KvanTTT Mar 15 2016 at 15:08

В твиттере про 78 ход пишут: "Taken a quick look at the logs: AlphaGo gave a probability of <1 in 10000 for Lee's brilliant move 78, so AG found this move very surprising".

tasman Mar 13 2016 at 15:04

Если переводчик не напутала, то Ли "просил" сыграть чёрными и это была шутка https://youtu.be/yCALyQRN3hw?t=22455

lksdfj89 Mar 13 2016 at 15:07

Разве это была шутка? Ребята из гугла, вроде бы, согласились.

tasman Mar 13 2016 at 15:09

Он в любом случае должен после белых играть чёрными. Он "попросил" играть чёрными, "так как белыми он уже выиграл". Ребята из гугла "согласились".

l27_0_0_1 Mar 13 2016 at 17:03

В последней игре кто будет играть черными должно было решаться броском монеты.

tasman Mar 13 2016 at 17:24

А где можно глянуть правила на этот счёт? Быстрый гугл не помог.

l27_0_0_1 Mar 13 2016 at 17:42

Это правила самой игры. Правда, я немного наврал, что броском, но вероятность выбора должна быть как у броска монеты.

tasman Mar 13 2016 at 17:51

Перечитал дважды, поправьте если я не правильно понял.
Нигири применяется:
1 В начале серии партий, для определения цвета (Ли и АльфаГо тоже разыгрывали нигири в первую игру), потом цвет чередуется.
2 После достижения счёта 3:3 в чемпионате, игроки снова разыгрвают нигири (я так подозреваю, что для 5 игр было бы 2:2)

Не нашёл по вашей ссылке правила, что бы в последней игре серии разыгрывали нигири в любом случае, пишут про ничью по очкам перед последней игрой.

l27_0_0_1 Mar 13 2016 at 18:38

Я так понимаю, что 3:3 (в нашем случае это 2:2, соответственно) относится к количеству сыграных партий за каждый из цветов, чтобы поставить игроков в одинаковое положение, в последней игре снова разыгрывается нигири.

tasman Mar 13 2016 at 18:47

After reaching a 3-3 tie in a championship series[...]
tie довольно однозначно переводится как ничья, равный счёт. (https://slovari.yandex.ru/tie/%D0%BF%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4/)
Есть даже значение "решающий матч после ничейного результата".

l27_0_0_1 Mar 13 2016 at 19:03

Я не могу привести вам никакого другого сорса за исключением тонны людей на реддите и хн, которые говорят что это так. Вероятно, это было где-то на стриме, так что если вам интересно, можете поискать.

Welran Mar 14 2016 at 06:47

Так как при счете 3-1 нет смысла играть пятую партию и пятая партия играется если никто не выиграл в предыдущих, то разыгрывать нигири перед последней партией и разыгрывать нигири при равенстве очков это одно и тоже.

lksdfj89 Mar 13 2016 at 13:59

У меня возникла пара вопросов.
Комментатор говорил, что развитие alphago позволит найти новые техники и улучшит игру людей. Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?
Alphago будет одинаково отвечать на один и тот же ход или там есть доля случайности? Т.е. можно ли повторить этот матч 1 в 1 и победить не размышляя над ходами?

valemak Mar 13 2016 at 14:11

Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?

Вне сомнения. С помощью компьютерного анализа шлифуются дебютные варианты. Множество прорывов совершено в эндшпильной стадии (вплоть до того, что просчитаны все 6-ти фигурные окончания).

Alphago будет одинаково отвечать на один и тот же ход или там есть доля случайности?

Присутствует доля случайности в виде метода Монте-Карло. Повторение партии 1 в 1 невозможно.

Mesmer Mar 13 2016 at 16:34

Уже все 7-ми фигурные посчитаны.

BelBES Mar 13 2016 at 16:43

Присутствует доля случайности в виде метода Монте-Карло. Повторение партии 1 в 1 невозможно.

Зависит от имплементации ГПСЧ, не? С одним и тем-же сидом, вероятно, партия должна повторяться 1 в 1.
ну и, естественно, нужна та-же версия системы… и тут вполне вероятно, что альфу могут дообучать между партиями…

KvanTTT Mar 13 2016 at 14:15

Вряд ли- там как минимум используется метод Монте-Карло, который привносит элемент случайности.

crazylammer Mar 13 2016 at 14:16

Комментатор говорил, что развитие alphago позволит найти новые техники и улучшит игру людей. Компьютер давно выигрывает в шахматы, но помогло ли это найти новые техники?

Я не специалист по шахматам, но вот заслуживающий внимания комментарий на английском:

Any opening is pretty much playable given the right amount of analysis. Moves that were once considered not playable have found new life in painstaking objective analysis.

Многие ходы в дебютах, которые до этого считались слабыми, получили новую жизнь

… Basically, now anyone can prepare for anyone

Раньше существовали более или менее закрытые (например, в СССР) "базы данных" про стили игры известных игроков. Сейчас с помощью AI такую информацию гораздо проще собрать и проанализировать.

paniquehistoire Mar 13 2016 at 14:20

Смотря насколько быстро обучается система. В долгосрочной перспективе определенно нет. В этом кстати нет большого отличия от человека (достаточно вспомнить любые случаи из жизни, когда повторяешь одну и ту же ошибку, уже зная о ней).

lanseg Mar 13 2016 at 14:02

А я за робота болел

valemak Mar 13 2016 at 14:11

Пятая колонна!

+15

a_batyr Mar 13 2016 at 14:16

Я тоже за АльфаГо болел. За ИИ наше будущее. Слава Роботам!

Namynnuz Mar 13 2016 at 14:48

И вы серьёзно рассчитываете, что после этого комментария они вас пощадят?...

+10

valemak Mar 13 2016 at 14:51

Шансов у людей в будущей войне со Скайнетом всё равно нет, единственная надежда на выживание — коллаборационизм :)

+14

Simplevolk Mar 13 2016 at 18:00

Сара Коннор — единственная надежда человечества!

PavelGatilov Mar 13 2016 at 22:03

А я всегда считал что будущее за апдейтом человеческого мозга и тела.

ankh1989 Mar 14 2016 at 07:51

Роботы тоже так думают (вспомнил Quake 4 где строгги "улучшали" людей и заставляли воевать за себя).

evtomax Mar 13 2016 at 14:05

Один человек сражался с целым дата-центром? Мне кажется, что надо ввести ограничение на потребляемую компьютером мощность. 200 Вт, например.

-4

Kroid Mar 13 2016 at 14:21

Ага, и количество нейронов заодно.
/irony

KvanTTT Mar 13 2016 at 14:28

Если подвести к человеку десятки кВт энергии, то играть он от этого лучше не станет. Этот вопрос уже обсуждался.

evtomax Mar 13 2016 at 14:31

А если против дата-центра будет играть команда из 1000 человек?

Sleepwalker_ua Mar 13 2016 at 14:39

попробуйте сначала согласовать 1000 человек. Это вам не это…
У каждого собственное мнение, видение игры, личный опыт, гордость, стремление к лидерству, тщеславие… Будет не игра, а фарс.

evtomax Mar 13 2016 at 14:52

Если я не знаю, как эффективно согласовать 1000 человек в данной игре, то это не значит, что такое невозможно.

Frosterman Mar 13 2016 at 17:14

Ну вот когда человечество выйдет на новый уровень биологического или технического развития и сумеет объединять или синхронизировать сознания в реалтайм режиме. В текущем варианте даже 10 человек в совместной игре воспроизведут ситуацию из басни Крылова и на выяснение чья идея лучше будет уходить гигантское кол-во времени и внимания.

Актуальней давать игроку больше времени на обдумывание. Практически во всех партиях у Седоля кончалось время и принимать важнейшие решения ему приходилось всего за 1 минуту.

evtomax Mar 13 2016 at 18:19

Толпа — не единственный возможный способ организации деятельности большого количества людей.

PavelGatilov Mar 13 2016 at 22:04

Обычная демократия? Собрать 1000 игроков А класса в ГО, а дальше за каждый ход или стратегию голосовать

Necrozyablo Mar 13 2016 at 23:20

Смысла нет. Даже в топ100 разница между 1 и 100 в 300 эло. При 1000 будет разница от 3600 до 2500 эло.
Есть к слову турниры командные, где ходы обсуждаются, но даже там больше чем 3 человека на команду нет.
Фактически можно взять человек 5-10 самых топовых и чтобы они сами из каждого хода играли и обсуждали варианты, тогда думаю профит будет. Но для этого нужно на партию выделять минимум часов 20. На этом шоу тяжело построить.

DeepBlue Mar 14 2016 at 04:37

Практика показала, что демократия в шахматах неэффективна:
en.wikipedia.org/wiki/Kasparov_versus_the_World
Сомневаюсь, что в го выйдет лучше.

UFO just landed and posted this here

KvanTTT Mar 13 2016 at 14:43

Такое количество людей не успеют синхронизироваться не только за игровое время, но и вообще за какое-то приемлемое время. А если время увеличить на порядок, то и компьютер станет глубже считать. Если брать слаженную команду до 10 человек, то может качественно что-то и улучшится.

tzlom Mar 13 2016 at 19:17

Ну конечно, а отдел бухгалтеров умнее Эйнштейна.

valemak Mar 13 2016 at 19:49

Если это касается скользких вопросов бухгалтерии, со всеми этими минимизациями налогов и при этом чтобы в тюрьму не сесть — и один толковый бухгалтер может оказаться умнее Эйнштейна.

evtomax Mar 13 2016 at 20:23

Эйнштейн гениальный физик. Но сомневаюсь, что он смог бы заменить отдел бухгалтеров.

mva Mar 13 2016 at 22:35

Вообще-то, математик...

-1

upsilon Mar 13 2016 at 23:22

Раскроете свою мысль?

UFO just landed and posted this here

plm Mar 14 2016 at 04:37

Вот это меня тоже возмущает. Но на мой взгляд надо ввести ограничение какое-то более относящееся к обоим партнерам. Максимальный вес, например. Вики говорит, что самый тяжелый человек весил 635 кг (хотя статью про самых тяжелых игроков в го не искал), вот пусть в эту массу впихивают все. Если во время игры можно есть-пить — компу повезло, топливо для генератора на всю игру можно не учитывать в этом весе. И никаких подсказок со стороны.

pnetmon Mar 13 2016 at 14:11

Для шоу лучший вариант — будет внимание к пятой партии.

lksdfj89 Mar 13 2016 at 14:12

Лучший вариант для шоу — 2:2.

Cr558 Mar 13 2016 at 14:33

Закидайте меня помидорами, добейте карму, но я думаю это шоу. Слишком драматично, эпично и все дела. Взяли не самого сильного игрока, но самого так понимаю колоритного из лучших. Сначала сделали сенсацию выиграв 3и подряд, теперь, интрига человека выиграл. Причем кто, кому поддается еще неизвестно. Может программа слабее, чем думают, может её ослабили для обострения ситуации, может AlphaGo лишь инструмент, а удаленно с помощью просчетов позиции на кластере играет комманда высокого уровня. А может я параноийю весной схватил. Но вот клянусь моей шапочкой из фольги, маркетологи бы сделали так, 5:0 неинтересно, а вот 3:2 или 4:1 и политически корректно к белковыми, и привлечет их внимание. А может это шоу в стиле смотрите какой гугл молодец. Пойду таблеток выпью, чтоле.

-17

GreenGoblin Mar 13 2016 at 14:50

Едва ли. В Азии к го относятся очень серьезно, гроссмейстеров почитают как национальных героев, всякие пафосные титулы им выдумывают. А если посмотреть на проигрывающего Седоля, все мысли о подставе должны сразу отпасть.
Да и гуглу это тоже ни к чему, в конце концов победа робота была вопросом времени, а миллион зелени для него — капля в море.

dom1n1k Mar 13 2016 at 16:52

Когда канадцы проиграли свой домашний ЧМ по хоккею, некоторые тоже говорили, что там все куплено :) Лично слышал своими ушами.

Frosterman Mar 13 2016 at 17:27

сразу видно человека который мало или вообще не играл против компа. Возьми любой файтинг или стратегию где приходится играть против ИИ. Выбери режим hardcore и получится стандартный расклад для среднестатистического игрока: первые стычки проигрываются вчистую, затем изучение тактики и алгоритмов ИИ и выстраивание контр-стратегии, затем первые удачи и в итоге гарантированные победы с минимальными усилиями. Для игрока который прошёл все эти стадии игра против этого ИИ уже теряет смысл т.к. победа достаётся слишком легко и предсказуема. Так и тут — если Ли Седоль нащупает слабые стороны ИИ, то сможет эффективно их использовать раз за разом. Вопрос только в том что с той стороны сидят программисты которые так же внимательно следят за косяками своего детища и в состоянии подкрутить алгоритм в перерывах между играми. Но в любом случае я бы не удивился результатам в стиле fail — fail — fail — win — win — win

UFO just landed and posted this here

Frosterman Mar 13 2016 at 17:56

сомневаюсь что на анализе одной единственной партии Alphago сумеет чуть ли не в реальном времени перестроить всю свою стратегию. Так может человек, но не ИИ построенный на современной реализации нейронных сетей.

Cr558 Mar 14 2016 at 01:55

Пальцем в небо. Как раз имею опыт игры против ИИ в шахматы и за 3и партии выяснить слабые места, так, чтобы вчистую выиграть невозможно, если только изначально его непревосходишь в разы. Го так же игра с полной информацией и здесь фишки как в героях/старкрафте и т.п. где компьютер не знает, что вы там на базе делаете и куда ведете основные силы не прокатят. Если всего за 3и игры Седоль нащупал выигрышную стратегию это говорило бы о слабости ИИ.

Кармы мало, поэтому отвечу здесь и другим. Все эти сказки о том как в Азии чтут Го, что прям сенсей сделает харакири если проиграет, напоминают небылицы, что все русские прям дофига шахматисты времен СССР. Да, у них есть традиция, но ненадо думать, что чм по Го, шахматам или городкам нельзя купить. Что прям в Азии все по чину. Вы еще экскурсоводам поверьте в курортном городке. Коррупция в том же Китае не хуже российской, куда больше, чем в США, за Южную Корею не знаю, но думаю не лучше Западной Европы. Поэтому детскую веру в принципиальных азиатов оставьте там же где жители Сибири ходят в обнимку с медведями, грузины все как один гостепреимные, евреи богатые, а французы донжуаны. Именно интрига выгодна всем, от Ли Седоля до Гугла. Если не понимаете почему так, почитайте те же азиатские тракты типа «Искусства войны».

Welran Mar 14 2016 at 07:31

Ну 3-0 это не интрига. вот было 2-1 тогда была бы интрига сумеет ли чемпион мира обыграть бездушную машину. А потом ещё и 2-2 вообще бы подогрело интерес. А так никакой интриги которая была бы «выгодна всем».

Cr558 Mar 14 2016 at 10:49

3:0 — нет, а вот 3:1после 3:0 уже интрига. После 4:0 почти все бы интерес потеряли, списав белковых на свалку истории.

sim31r Mar 14 2016 at 13:10

А при счете 3:2 общество потребует продолжения игры, интерес сохранится на годы.

valemak Mar 14 2016 at 07:35

Про харакири была шутка, разумеется, высмеивающая как раз стереотипы про азиатов. Тем паче, что харакири, вроде как, не входит в корейскую традицию.

KvanTTT Mar 13 2016 at 14:47

Гугл заинтересован в победе в сухую, и это как раз таки очень эффектно было бы. Поэтому намеренно ослаблять AlphaGo у него точно нет резона.

ZlodeiBaal Mar 13 2016 at 16:05

Мой друг, который очень круто в Го играет говорит, что первая ошибка была на 23 ходу. Это какая-то очень стандартная комбинация, в которой альфа го сыграл как новичок. Потом бот повторил два раза ход из второй партии (на 25 и 47 ходу), который тогда Ли поверг в шок, а теперь Ли уже явно подготовился как против такого играть. Ну и да, потом серия явных ошибок, особенно после большого окружения.

f0rk Mar 13 2016 at 22:47

Судя по вашему комментарию, ваш друг не очень круто играет в го. "ход из второй партии" — это стандартный прием, даже название у него есть — "удар в плечо". Его необычность во второй партии в том что он был сделан по отношению к камню стоящему на 4-й линии, к камню на 3-й (как в последней партии) его играют достаточно часто и ничего необычного в этом нет. Между прочим, до хода 78 и последующей комбинации в центре, позиция на доске многими профессионалами оценивалась как благоприятная для белых. Ход E4 (23-й) тоже не выглядит как ошибка, скорее как проверочный ход. Ли Седоль потратил 2 хода чтобы этот камень забрать, мне сложно оценить эту комбинацию, но по моему субъективному мнению не очень крутого игрока (3 дан РФГ), плохим этот ход назвать сложно, и уж точно не тянет это на "игру новичка".

ZlodeiBaal Mar 15 2016 at 01:56

Да, не очень, наверное. 4д на европейском сервере, 6д на китайском и корейском
В России вроде года 3-4 назад дошёл до 2д, потом забросил местные турниры. По рейтенгу РГФ был топ-20 тогда, чемпион Питера.

Я сам играть не умею. Сказанное мной он озвучивал с отсылкой к разбору партии Ли Седоля 9ми данами. Там есть два англоговорящих, один американец, один китаец.

f0rk Mar 15 2016 at 14:43

Как-то не сходится все. 2д никогда не мог быть в топ-20 РФГ, этого недостаточно даже чтоб в сотню войти, хоть сейчас, хоть 3-4 года назад. Да и чемпионат Питера 2д вроде не выигрывал на моей памяти. И не могу я поверить, что 4д скажет что E4 это ход новичка (разборы партий я тоже смотрел). Не скажете как вашего друга зовут?

ZlodeiBaal Mar 15 2016 at 15:10

Евгений Дергач его зовут.
Точность формулировок я мог не сохранить, но смысл был примерно такой. Е4 -явный оверплэй, свойственный новичкам, два удара в плечо — ни о чём, причём первый — ошибка Ли что он не ответил агрессивно.

f0rk Mar 15 2016 at 15:55

Е4 -явный оверплэй

Спорная формулировка, такой ход в принципе играют, можно подумать над тем, насколько вовремя он был сыгран.

свойственный новичкам

Вот это точно нет. Там есть хорошие продолжения. Если новичек и может сыграть такой ход, то только случайно :)

два удара в плечо — ни о чём

Первый был вполне о чем, и он как раз был связан с продолжениями в углу, для того чтобы сыграть более агрессивный ход в углу, черному потребовалась бы поддержка на стороне. Второй более спорный на мой взгляд, я бы накрывал через пункт сверху в такой позиции, но не мне судить машину, которая мне камней 6 форы дать может :)

Но в текущей формулировке, у меня гораздо меньше желания назвать написанное ерундой.

f0rk Mar 14 2016 at 01:04

Ну и да, потом серия явных ошибок, особенно после большого окружения.

Явная ошибка со стороны альфаго была в партии только одна, 97-й ход C4 и произошла она после того как бот "понял" что шансы на выигрыш явно упали. Возможно, что это связано с алгоритмом, который не учитывает величину выигрыша/проигрыша в очках, его единственная цель максимизировать вероятность выигрыша не зависимо от его величины. Думаю что инженерам гугла стоит подумать о том, чтобы в ситуациях, когда бот проигрывает, он менял стратегию и начинал играть на уменьшение отрыва а не на увеличение вероятности выигрыша. Если отрыв в очках сократить, то появляется возможность обыграть человека в концовке.

dom1n1k Mar 13 2016 at 16:54

Мне кажется, цвет нужно было не разыгрывать, а чередовать.
Плюс я бы дал человеку право выбора цвета в первой партии.

-1

yefrem Mar 13 2016 at 16:54

Как и в первой и второй играх, Седоль исчерпал время раньше оппонента. То есть в какой-то момент человек был вынужден тратить всего по минуте на ход.

Э… ограничение времени при игре с ИИ? Но ведь это нечестно, разве нет? Может я не понял из-за того, что не играю в го, но звучит очень странно.

Frosterman Mar 13 2016 at 17:52

Стандартные правила игры в Го, по которым играют оба. А правила проверены временем и ориентированы на физические возможности человека. Без проф подготовки поиграть в Го против равного или более сильного игрока много не получится — уже через 2-3 часа такой игры ощущаешь себя как выжатый лимон и физической усталостью сравнимой с пробежкой в десятки км. Да и растягивали бы эти партии фиг знает как — проигрывающий игрок будет до последнего тянуть при каждом ходе пытаясь найти выход из патовой ситуации…
Да и насчёт честности тут тоже не всё так просто — если дать человеку больше времени, то придётся его же давать и ПК. А это — лишние итерации и возможность дальше просчитать последствия хода. При наличии неограниченного времени ПК даже с самыми примитивными алгоритмами будет иметь 100% шанс победы

RMV1983 Mar 13 2016 at 18:03

Стандартные правила игры в Го, по которым играют оба. А правила проверены временем и ориентированы на физические возможности человека.

Правильно. Человека. Вот он и упёрся в эти ограничения. Для ИИ ограничения должны быть другими.
Хотя для первых игр важна принципиальная победа ИИ.

При наличии неограниченного времени ПК даже с самыми примитивными алгоритмами будет иметь 100% шанс победы

Не согласен. В этом случае скорее вопрос кто кого переживёт. Вроде бы срок службы микросхем пока что меньше продолжительности жизни человека.
(Вспомнилась почему-то притча про Ходжу Насредина. И его фраза. Либо ишак, либо падишах, либо я.)

Frosterman Mar 13 2016 at 18:48

Правильно. Человека. Вот он и упёрся в эти ограничения. Для ИИ ограничения должны быть другими.

возможно. Но тут уже проблема как высчитать эти ограничения. Для ИИ ограничение времени на ход имеет даже более серьёзные последствия, чем для человека. Человек в конце концов может сделать ход инстинктивно, а вот пк без точных расчётов превращается в дебила. Те же блиц партии с 15ти секундными ходами AlphaGo вряд ли сможет выиграть даже у более слабого противника.

Имхо самый интересный вариант сейчас был бы с партией растянутой на несколько месяцев. Скажем 12 часов днём отдаётся человеку на ход и 12 часов ночью для ПК. Обмен ходами раз в сутки. Это даст максимальную фору обоим участникам и позволит использовать все свои ресурсы и возможности для обоих сторон.

RMV1983 Mar 13 2016 at 19:45

возможно. Но тут уже проблема как высчитать эти ограничения.

Я предлагаю подойти с другой позиции. В каком направлении мы бы хотели видеть развитие техники? И уже отсюда придумывать ограничения. Ведь понятно что какие бы ограничения придуманы не были, их будут пытаться обойти. Так пусть пытаются в той сфере, что даст пользу всей отрасли, а не её отдельному сегменту.
Это касается качественных характеристик, т.е. того — что вообще стоит ограничивать?
А по поводу количественных, т.е. конкретных значений всё проще, мне кажется.
Сейчас же не проводятся регулярные соревнования и вопрос пока ещё не такой острый.
Нужно взять текущее состояние AlphaGo. И с каждым годом уменьшать его, скажем на 10%. Конкретное значение можно брать скажем из среднего прироста в отрасли. Это оставит множество векторов для развития. А если окажется, что этого не достаточно и ИИ выигрывает в 100%, то тогда можно будет подумать над ещё одной качественной характеристикой.
Вообще, этот вопрос сейчас мало актуален, поскольку любое нормальное ограничение урежет возможности ИИ слишком сильно. Здесь мне видится актуальным именно постепенное поступательное изменение/улучшение.

А ваш вариант интересный, согласен. Особенно сейчас, когда человек ещё может победить.

agranom555 Mar 13 2016 at 17:53

Время хода ограничено. Все правильно. Ведь тогда и ИИ может думать па часу на ход. А так тоже вынужден быстро думать

RMV1983 Mar 13 2016 at 18:05

Э… ограничение времени при игре с ИИ?

Я вот тоже не понимаю.

То есть в какой-то момент человек был вынужден тратить всего по минуте на ход. AlphaGo же хорошо распоряжалась временем — это результат добавления нейросети, которая помогает управлять им.

Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo.

При чём здесь эффективность нейросети, если используется огромнейший кластер? Если производительность по времени будет недостаточной, то, насколько я понимаю, мощность можно увеличить. И делать так дотех пор, пока скорость не станет приемлемой.
Да, нейросеть вещь необходимая. Но именно мощность вычислений ничто (кроме денег) не мешает нарастить другим путём.
У человека же мощность, в силу биологических причин, пока что, нарастить не представляется возможным.

Должно быть какое-то ограничение. А то так (условно конечно) все сервера гугла можно на ограниченное время подключить к расчётам, а потом удивляться, что эта система принимает решение быстрее человека.
Да, победа без ограничений это важный шаг. Можно сказать, принципиальный. И теперь вопрос лишь в мощности. А значит, что пора придумывать ограничения.

Да, я уже видел ветку с ограничением по мощности. Забавно. Если такое примут, то будет развиваться энерго-эффективность. Но принять такое ограничение для всег кластера… мне кажется не реально. Но согласен, к этому можно стремиться.
Есть ещё идея, на будущее. ИИ должен присутствовать на состязании целиком. И успевать "сесть за стол" за то же время, что и человек. Опять же, прямо сейчас это не реально.

В будущем, мне кажется было бы не плохо постепенно вводить эти ограничения. В таком случае, мы получим прогресс в миниатюризации энерго эффективности. Уже сейчас можно начать, установив текущие мощности AlphaGo как максимальную планку. И договорившись понижать е каждый год. Причём даже не важно насколько.
Можно даже забить на всё это и придумать нечно иное. Но миниатюризация и энерго эффективность мне кажутся более предпочтительными. Что насчёт иметь своего персонального AlphaGo на телефоне или умных часах и не переживать по поводу батареи?

Here_and_Now Mar 13 2016 at 19:50

Для начала, мне кажется, DeepMind и Google будут решать проблему самого ИИ в том или ином виде.

А проблема энерго-эффективности — она решается на уровне самого гугла. Скажем DeepMind добавят что-то в поисковый движок, и команда гугла будет работать над оптимизацией. Т.е. энерго-эффективность только тогда, когда алгоритм интенсивно работает над real world problem.

Zavtramen Mar 13 2016 at 18:48

Канал нужен для связи с дата-центрами компании, где на сотнях процессорных ядер и видеоускорителей запускается AlphaGo

И какую же именно информацию они гоняли от доски до дата-центра что им потребовался отдельная оптика? Просто перестраховались за связь вообще, а написали так, как будто там видео-стримингом занимались. По сути там и мобильного Edge много было бы )

Here_and_Now Mar 13 2016 at 19:44

Так и представляю, как сегодня ночью перед следующей игрой, Альфа Го будет посылать армии друг на друга, эмулируя проигранную игру снова и снова, а какой-то внутренний процесс подкрепления с плёткой будет приговаривать "Не делай больше таких глупых ошибок".

Halt Mar 13 2016 at 20:08

Справедливости ради стоит отметить, что этого не происходит. Разработчики уже заявляли, что между партиями программу не модифицируют и в процессе никаких рычагов воздействия не имеют. Видимо посчитали, что так будет интереснее.

RomanStrlcpy Mar 13 2016 at 21:52

А самообучени в процессе игры происходит?

zagayevskiy Mar 13 2016 at 22:02

Одна игра ни на что повлиять не может, скорее всего.

Halt Mar 14 2016 at 07:25

Чтобы обучаться на текущих ходах, надо знать их реальный исход. Если партия была выиграна, то сети накидывается поощрение, ход за ходом.

Подозреваю, что в течение партии этого не делают, ибо на руках у машины будет только оценка вероятности успешного исхода партии из заданной позиции, ну и прикидки монте-карло, которые тоже могут быть необъективными (как показала нам 4 партия).

solariserj Mar 13 2016 at 22:45

Ну ИИ называют по традиции с машинным противником. Он ведь построен на нейронной сети, то есть такая "китайская комната" натренированная делать определенные ходы в определенных ситуациях. Поэтому с таким подходом можно любую логическую игру выйграть, главное грамотно описать

SkidanovAlex Mar 14 2016 at 06:12

Утверждается, что люди будут всегда называть ИИ систему, способную решать множетсво задач, которые еще не решены текущим ИИ, а все, что решает текущий ИИ, называть не настоящим ИИ: о)

Ваш мозг тоже построен на нейронной сети, то есть это тоже такая "китайская комната" натренированная на какие-то базовые задачи, многие из которых более тривиальны, чем игра в го. В частности, она пока у вас плохо научена правильно писать слово "выиграть".

+11

SkidanovAlex Mar 14 2016 at 06:07

Система признаёт поражение, когда оценка шанса победы падает ниже 20 процентов

Это не верно, согласно этой статьи: https://habrahabr.ru/post/279071

AlphaGo сдается, если у всех ходов Q-score < -0.8, т.е. вероятность выиграть меньше 10%.

Интересно, что в октябре Фань Хуэй тоже выигрывал у AlphaGo, но только в одной из пяти неформальных игр.

это тоже не верно, он выиграл в двух из пяти, и там было важное ограничение — 30 секунд на ход: https://gogameguru.com/go-commentary-deepmind-alphago-vs-fan-hui-game-5

He won two unofficial games against AlphaGo (30 seconds per move), but lost all the official games.

atomlib Mar 14 2016 at 06:23

Данные про 20 процентов — это слова инженера Google. Про две игры исправил, спасибо.

avenikolay Mar 14 2016 at 09:16

"Да придёт спаситель".

sim31r Mar 14 2016 at 13:18

Удивила логика программы. Есть вероятность выиграть, хоть и 20%, а она сдается. Такое может быть обоснованно при экономии облачных мощностей. Но на этапе обучения мощности требовались выше, чем при игре, так что вариант отпадает.

vxd_dev Mar 14 2016 at 15:27

Мне, наоборот, это кажется логичным, ведь если твой противник в данной конкретной игре смог снизить твои шансы до 20% (выше упоминалось 10%), то в данный момент он сильнее и нужно ждать откровенной ошибки с его стороны, чтобы изменить ситуацию, а тут, насколько я понимаю, еще появляется лимит по времени.

UFO just landed and posted this here

atomlib Mar 14 2016 at 15:40

Это заложено намеренно для сохранения культуры поединка, чтобы не получалось, что машина продолжает играть, хотя проигрыш уже очевиден.

UFO just landed and posted this here

valemak Mar 14 2016 at 16:19

Да и в шахматных поединках (если это солидное соревнование, а не во дворе на лавочке играют) тоже не играют до мата включительно.

Если тянуть до последнего, тот тут одно из двух. Или надеешься что соперник грубо ошибётся и своим нелепым ходом даст шанс. Это полнейшее неуважение к сопернику, особенно если это игрок высшей категории. Как будто надеешься, что перед тобой на самом деле не гроссмейстер, а какой-то дурачок.

Или же речь о том что противник в цейтноте, израсходовал своё время и вот-вот на его часах упадёт флажок. Тогда вполне корректно продолжать игру. Однако в го обычно контроль времени, в котором цейтнота как такового практически возникнуть не может. В худшем случае у противника 1 минута на 1 ход. Для игрока уровня Седоля это абсолютно достаточно, чтобы спокойно закрепить победу.

valemak Mar 14 2016 at 16:24

Кроме того в го аналога мата нет. По окончанию игры подсчитываются очки.

Если в шахматах часто есть призрачный шанс подловить соперника на внезапную комбинацию, то го это игра в которой столь внезапные повороты в заключительной стадии партии практически исключены. В конце партии игроки пожинают плоды своей терпеливой стратегии, если у кого-то очевидный выигрыш, то надеяться на чудо не приходится — таковы особенности игры.

vlivyur Mar 14 2016 at 16:19

10% шанс на победу это далеко не очевидный проигрыш.

valemak Mar 14 2016 at 16:29

Смотря что за игра. В шахматах одна удачная комбинация может всё перевернуть с ног на голову. В го совершенной другой характер игры, если преимущество опытного противника достаточно большое, то на спасение шансов практически нет.

SkidanovAlex Mar 14 2016 at 19:27

то на спасение шансов практически нет.

Тогда это и не шанс 10%. Шанс 10% — это достаточно ортогональная типу игры вещь, которая говорит, что если бы мы сейчас вселенную форкнули раз так миллион, то в 100К вселенных мы бы выиграли. Учитывая специфику го, это на деле должно обозначать достаточно близкую позицию с незначительным перевесом.

valemak Mar 14 2016 at 19:39

Насколько я понимаю из объяснений по поводу того как AlphaGo с помощью метода Монте-Карло ищет оптимальный новый ход, то могу предположить по поводу упомянутых 10-20% примерно следующее:

Из возможных условно случайных продолжений игры, в 10% вариантов преимущество у компьютера, 90% — у человека. Но это отнюдь не значит, что на практике вероятность того что, что реальная игра с вероятностью 10-20% пойдёт по пути из этих 10-20%, найденных с помощью метода Монте-Карло. Так как противник-человек пользуется не методом Монте-Карло, а просто идёт по очевидно выигрышному пути, то выигрышные для него "монтекарловские" 90% в реальности — это больше 99%.

kazaff Mar 15 2016 at 22:18

youtu.be/mzpW10DPHeQ
9 часов назад уже сыграли пятую игру.

Show the best of all time