Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Но стратегия все равно зависит от того, каким по очереди ты ходишь
Многие комментаторы говорили, что игра за белых у Альфаго немного получше.
По сути первый ход в партии даёт преимущество только в одном локальном участке, т.е. начинающий потенциально имеет на один участок доминирования больше. Ну и не стоить забывать что как только в локальной стычке определяется победитель и он ставит решающий камень, после которого становится очевидным его преимущество, проигравшая сторона автоматом делает первый ход в любой другой перспективной для него части поля. Т.е. право первого ход а в той локальной зоне уже за ним.
Дальше эта сеть обучалась и тюнилась на игре сама с собой — так что замеченные ошибки были исправлены и не оказывают своего негативного влияния.Так не бывает: если вероятность выбора конкретного хода в течение «бутстрапа» упала в ноль, как в том-самом-случае, сетка может хоть вечность играть сама с собой, но так и не узнать, что есть шанс сыграть лучше. Либо нужно вводить какой-то элемент случайности, что сильно замедлит обучение, т.к. будут выбираться сильно неоптимальные ходы, и мы вряд ли можем себе такое позволить слишком часто (но это хорошая тренировка поведения в случае ошибок), либо нужно, опять же, периодически заливать в неё новые игры с живыми людьми, которые имеют свойство ошибаться. Вариантом выхода из такой ситуации является игра с несколькими конкурирующими нейросетями, которые быстро и жёстко укажут первой на её ошибки. Но это потребует кратно увеличить используемые для обучения ресурсы.
Если AlphaGo запустить на игровой Го-сервер KGS, никто не сможет определить, что играет не с человеком.
Да, AlphaGo понимает игру Го лучше человека.Мне не очень нравится слово «понимает» в этом контексте. Оно как бы подразумевает, что AlphaGo обладает какими-то сакральными знаниями о игре, которых у нас нет, однако это не так. ИИ по сути делает то же, что и игрок-человек — на основании собственного опыта и просчета на N ходов вперед пытается найти наиболее перспективный ход — но, в силу нашей ограниченности, делает это гораздо быстрее и глубже.
Вопрос, может ли машина мыслить, не интереснее вопроса, может ли подлодка плавать.
в алгоритмах машинного обучения нет никакой магии.
инженеры гугла всего лишь сумели прикрутить к монтекарловскому брутфорсу хорошие эвристики на основе сверточных нейросетей.(пожимая плечами) типичный «маленьгий шаг одного человека»… Глядя на посудины «эпохи великих географических открытий» — вот так оно часто и бывает — на обычных в общем-то для современника инструментах (кораблях и экипажах) человечество и вплывает в новую реальность. Это только для ракет и атомных бомб потребовались весьма неординарные сверхусилия, чаще прогресс эволюции идёт более мелкими шажками
Пример: пусть время от времени возникают события, которые требуют чтобы одна особь пожертовала собой для спасения вида. Пусть в популяции откуда-то есть ген, обладатели которого жертвуют собой в такой ситуации. Со временем распространенность этого гена будет падать — пока не достигнет нуля, после чего вид вымрет.
Случилось это после пяти часов напряженной игры.Мне кажется тут имели место уже не только интеллектуальные способности.
Ли Седоль проиграл AlphaGo в пятой, заключительной партии в го