Комментарии 16
Я тоже предложил ему сыграть 9х9, и он просто стал отрисовывать поле с координатами. И играл по правилам, пока не попутал и не попытался поставить камень на место, где уже стоял мой камень. Потом стало совсем плохо, он слил большую группу, но не сумел снять ее без моей помощи. И дальше просто ставил камни куда придется. Несколько раз пришлось ему описывать по координатам, какую группу надо снимать.
Уровень 19к примерно.
Но это не значит, что он действительно так плохо играет. Возможно, он притворяется.
Все эти попытки взаимодействия с ИИ, от попыток написать проект его силами, до попыток играть, напоминает какое то сильное колдунство.
Нет ни моделей, почему и как оно будет работать, какие могут быть ошибки и какие ожидаемые результаты.
Вместо этого идут мольбы и разговоры с астральным планом, в целях "подчинить духов" и постоянный перебор правильных слов заклинания. Между этим приносятся жертвы, производятся ритуалы предсказаний и ясновиденья.
Думаю, если дать ему свободный доступ в Интернет, то у него вполне хватит сообразительности подключиться к какому-либо онлайн-боту с Катаго. Для уже решённых задач (а Го на сегодня - задача практически решенная) ИИ совершенно не возбраняется использовать готовые инструменты.
Другое дело, что для общения с Катаго ему всё равно придётся освоить формат SGF (ну, или протокол GTP).
На днях, взял из Интернета, рандомную, несложную принципиальную схему дозиметра и скормил её DeepSeek-у. Я был в шоке, он мне ответил, что это схема дозиметра ))
AlphaGo использует нейросети для оценки позиции и предсказания ходов, но рекомендации нейросети не используются в игре напрямую, а проходят проверку MCTS, с распараллеливанием и использованием значительных вычислительных мощностей. Настоящий AGI должен обходиться без таких костылей.
Ну так MCTS должен достигаться за счет reasoning, который начинает обретать популярность.
Начнём игру с напоминания о том, что такое SGF.
По моему мнению - это неудобный формат взаимодействия, прежде всего для человека. Для нейронки возможно тоже. Я бы попробовал что-то такое:
. . B0 . .
. B1 W0 B2 .
. . B3 . .
. . . . .
Собственно это почти то же самое, что DeepSeek выдал после того, как его попросили об этом:
покажи как ты видишь доску, используя ascii-графику
только еще с номерами ходов.
Нет, чёрные не будут больше атаковать. Галлюцинируй дальше, дорогой силиконовый малыш!
Как можно видеть, страхи перед AGI несколько преувеличены.
Имхо, в подобных играх нужно очень сильно учитывать двухмерность, а не просто поток токенов. Но я не в курсе, есть ли нейросетки, которые сильно акцентируются на подобном моменте (возможно есть те, которые заточены на обработку таблиц?), но можно поискать. Либо еще можно попробовать представлять доску как изображение - это может помочь.
А еще можно попробовать для начала обучить движок хотя бы на правилах игры, на самых простых примерах (типа в такой ситуации нельзя ставить туда, в другой ситуации белые получают столько-то очков и т.д.). Может тоже попробую поиграться с этим, если ресурсы и время свободится.
Ну так MCTS должен достигаться за счет reasoning, который начинает обретать популярность.
Для меня это звучит как "в огороде бузина, а в Киеве дядька". В любом случае, я знаю, что MCTS прекрасно работает в связке со специализированными нейросетями. Мне интересно, могут ли с игрой справиться нейросети общего назначения без MCTS.
По моему мнению - это неудобный формат взаимодействия
Мне он удобен: берём любой SGF-редактор и пользуемся, что касается чатботов: какая им разница работать с последовательностью слов или последовательностью ходов? Ну и кстати, SGF - это стандарт.
подобных играх нужно очень сильно учитывать двухмерность
И специализированные нейросети в AlphaGo так и делают. И даже при этом играть напрямую с профессионалами они не могут. Требуется MCTS для очень не дешёвой проверки их рекомендаций. И это не то что меня интересует.
А еще можно попробовать для начала обучить движок хотя бы на правилах игры
Возможно. Но я не готов заниматься этим сейчас.
Для меня это звучит как "в огороде бузина, а в Киеве дядька".
Я имею в виду, что MCTS - это по сути рандомизированный перебор, а reasoning в нейросетях (начиная с OpenAI o1) - это итеративное обдумывание, т.е. по сути тоже перебор каких-то идей. Что если сделать так, чтобы думающие нейросети перебирали множество вариаций во время ответа на вопрос о том, какой следующий ход? И это не выходит за рамки общего назначения.
И даже при этом играть напрямую с профессионалами они не могут. Требуется MCTS для очень не дешёвой проверки их рекомендаций.
Ну смотря с какими. Даже без запуска MCTS текущая версия KataGo играет на уровне выше дана только на одних лишь предсказаниях.
KataGo has a fully working implementation of Monte-Carlo Graph Search, extending MCTS to operate on graphs instead of just trees! An explanation can be found here Monte-Carlo Graph Search from First Principles. This explanation is written to be general (not specific to KataGo) and to fill a big gap in explanatory material in the academic literature and hopefully it can be useful to others!
и нигде не нашёл упоминаний о том, что это опционально
Без GUI тоже настраивается, здесь есть описание maxVisits
: https://github.com/lightvector/KataGo/blob/master/docs/Analysis_Engine.md
Го это вы, конечно, замахнулись. Он и в крестиках-ноликах может налажать. Все позиционные игры это очень сложно для языковых моделей - им-то строка текста приходит, которую надо переразмечать, разбивая на несколько строк в зависимости от поля. А уж специфические форматы понимать это совсем сложно. Я тестирую модели на игре в Балду и там пока всё очень плохо. Только o1/o3 изредка могли выдавать верные хода.
Играем в Го с DeepSeek