Я например знаю хорошо только три — один ферзевый гамбит и пару, названий которых не помню
Ого, у меня рейтинг (на lichess) ~2050 rapid, ~1950 blitz, я очень много учу дебютную часть, играю последние годы только d4 (очень редко c4) и не могу с уверенностью сказать, что хотя-бы в общих чертах знаю этот (d4) дебют o-O )))
Хотелось бы строгого доказательства, а не голословных заявлений.
Вы, наверное, пропустили в статье. Вот доказательство:
После 20-го хода на доске творится невообразимая стратегическая борьба. Но если нейросеть шаг за шагом минимально укрепляет свою позицию, избавляясь даже от призрачных слабостей, то движок с 24-го по 29-й ход просто топчется на месте ладьёй.
Интересно, что Stockfish в упор не видит стратегических решений Alpha Zero, оценивая позицию как абсолютно ничейную. Но в результате минимальных укреплений позиции к 39-му ходу оказывается, что все фигуры белых активны, а чёрный конь и слон занимают пассивную оборонительную позицию. А после размена ферзей и ладей даже Stockfish оценивает преимущество нейросети в +2,2. Ещё несколько ходов – и король черных зажат в углу доски, а конь в одиночку не способен справиться с проходной пешкой. Поэтому программа сдалась.
Т.е. веса в процессе обучения не подстраивались, вот как её запустили так она с изначальным набором весов и работает до сих пор?
Нет, «Alpha Zero не использует ничего, кроме правил.» — означает, что сетка не использовала ГОТОВЫХ баз партий, окончаний, сеток ценности фигур и т. д. при подстройке весов.
Человек раньше был сильнее машины, потому что он обладает интуицией
Не сколько интуицией, сколько позиционной игрой. Машина находила выигрыш, условно, пешки в 3 хода. А шахматист, который отдал пешку, видит, что можно все фигуры поменять, остаться с слоном против слона и двумя проходными пешками на разных флангах против трёх в центре. Своим королём и слоном он затормозит пешки в центре, а машина за двумя зайцами на крайних вертикалях доски не угониться. Компьютеру, чтобы не брать «бесплатную» пешку нужно было-бы считать на 30-40 ходов вперёд (это 60-80 полуходов, довольно глубоко даже для современных движков, запущенных не на серверах).
Как раз-таки «жадность к пешкам» движков эксплуатировалась, в том числе, тем-же Каспаровым, когда он обыгрывал движки))
Согласен.
Вообще, судя-по всему, подавляющее число разработчиков игр (особенно под мобилы) вообще не думают про пользователя. Просто тычут рекламу в лоб и не паряться.
Вы молодцы! Сама игра будет бесплатной?
Ого, у меня рейтинг (на lichess) ~2050 rapid, ~1950 blitz, я очень много учу дебютную часть, играю последние годы только d4 (очень редко c4) и не могу с уверенностью сказать, что хотя-бы в общих чертах знаю этот (d4) дебют o-O )))
Вы, наверное, пропустили в статье. Вот доказательство:
Нет, «Alpha Zero не использует ничего, кроме правил.» — означает, что сетка не использовала ГОТОВЫХ баз партий, окончаний, сеток ценности фигур и т. д. при подстройке весов.
Не сколько интуицией, сколько позиционной игрой. Машина находила выигрыш, условно, пешки в 3 хода. А шахматист, который отдал пешку, видит, что можно все фигуры поменять, остаться с слоном против слона и двумя проходными пешками на разных флангах против трёх в центре. Своим королём и слоном он затормозит пешки в центре, а машина за двумя зайцами на крайних вертикалях доски не угониться. Компьютеру, чтобы не брать «бесплатную» пешку нужно было-бы считать на 30-40 ходов вперёд (это 60-80 полуходов, довольно глубоко даже для современных движков, запущенных не на серверах).
Как раз-таки «жадность к пешкам» движков эксплуатировалась, в том числе, тем-же Каспаровым, когда он обыгрывал движки))
Вообще, судя-по всему, подавляющее число разработчиков игр (особенно под мобилы) вообще не думают про пользователя. Просто тычут рекламу в лоб и не паряться.
Вы молодцы! Сама игра будет бесплатной?
Как вы планируете монетизировать продукт?