Контр-интуитивность этого результата не перестаёт удивлять. Умом всё понимаешь — дзета-функция Римана, расширение области определения, и т.д. А вот как задумаешься — начиная с какого слагаемого сумма будет уменьшаться? А с какого — становится меньше нуля? Сразу становится понятен анекдот про «он стал поэтом, для математика ему не хватило воображения».
Хороший вопрос! Основное предположение, на котором основан метод — это то, что признаки разного сорта так или иначе встречаются в достаточном количестве в рассматриваемых партиях. Конкретное их распределение, которое может зависеть от стиля программы, нам не важно — лишь бы их было много. Дальше работает своего рода байесовский подход. Признак полезен с точки зрения статистики результатов? Повышаем его вес. Не полезен? Тогда понижаем.
А распространение на игру с другими противниками — вполне удачно, судя по приведённым в статье результатам тестов. Подождём ещё, как программа себя покажет в классическом контроле, например, в рейтинге CCRL.
Может быть, такой же эффект можно получить, если ничейному исходу присваивать не 0.5, а какую-то другую оценку с точки зрения той стороны, чей ход. Своего рода contempt factor, который есть в настройках многих движков (даже в GreKo есть, но его корректную работу я почти не проверял).
Но, наверное, программу придётся слегка переделать — она должна научиться отличать оценку за себя от оценки за противника. Для более миролюбивой игры недостаточно меньше ценить атаку на короля — надо меньше ценить именно свою атаку, а за противника по-прежнему смотреть все угрозы и правильно от них защищаться.
У меня метод начал работать после выполнения трёх условий: а) использование партий программы против самой себя, а не игр сторонних игроков, б) количество партий > 10000, в) отказ от замысловатых методов оптимизации вроде случайного градиента и т.п. в пользу простейшего покоординатного спуска.
Всему своё время. Пока что GreKo и Stockfish находятся в разных весовых категориях. Для тестирования удобнее использовать более близкие по силе программы, чтобы набираемый процент очков не слишком отличался от 50% в ту или другую сторону.
График изменения материала относится к другой сессии обучения, он приведён в порядке примера. Я добавлю в текст статьи соответствующий комментарий.
12 пешек за ферзя — вполне нормальное значение, оно используется не только в GreKo. Важно понимать, что это только один из членов оценки, другие связанные с ферзём и пешками признаки вносят существенные поправки.
> Другой вопрос, что государство может воспользоваться их умениями в своих интересах
Совершенно верно. Вполне возможно, товарищу будет предложен соответствующий выбор — между условным шитьём варежек и не менее условным взломом серверов Пентагона.При этом совсем не обязательно, что это предложение будет сопровождаться публичной оглаской.
Вы не замеряли скорость перебора (в позициях в секунду), которую даёт этот движок? Интересно сравнить со специализированными шашечными программами, написанными на C/C++.
ОК, я отвечу как человек, потративший на изучение темы не пару дней, а несколько семестров в различных курсах не самого слабого физического вуза (МФТИ). На мой взгляд, Вы решаете одну задачу, а ответ пытаетесь выдать за решение другой. Электростатика в общем случае не аналогична магнитостатике. В реальности у нас нет магнитных зарядов, а есть только магнитные диполи. Соответственно, кулоновский закон (где 1/r) для них не выполняется, там следующий порядок малости. Вам следует решать электростатическую задачу для диполей.
Желаю Вам полнейшего выздоровления! (скорейшего — не говорю, здесь важнее надёжность).
Сам браузером Вивальди ещё не пользовался, но обязательно скачаю и посмотрю, раз там такие пассионарные разработчики.
А распространение на игру с другими противниками — вполне удачно, судя по приведённым в статье результатам тестов. Подождём ещё, как программа себя покажет в классическом контроле, например, в рейтинге CCRL.
Но, наверное, программу придётся слегка переделать — она должна научиться отличать оценку за себя от оценки за противника. Для более миролюбивой игры недостаточно меньше ценить атаку на короля — надо меньше ценить именно свою атаку, а за противника по-прежнему смотреть все угрозы и правильно от них защищаться.
12 пешек за ферзя — вполне нормальное значение, оно используется не только в GreKo. Важно понимать, что это только один из членов оценки, другие связанные с ферзём и пешками признаки вносят существенные поправки.
Совершенно верно. Вполне возможно, товарищу будет предложен соответствующий выбор — между условным шитьём варежек и не менее условным взломом серверов Пентагона.При этом совсем не обязательно, что это предложение будет сопровождаться публичной оглаской.
Сам браузером Вивальди ещё не пользовался, но обязательно скачаю и посмотрю, раз там такие пассионарные разработчики.