Pull to refresh
129
0.2
Ivan Kochurkin @KvanTTT

Software Developer at JetBrains (Kotlin Compiler)

Send message

Это функция IntelliJ, которая позволяет быстро сохранить и откатить изменения (еще неправильно написал, правильно shelve). Использую ее внутри IntelliJ: https://www.jetbrains.com/help/idea/shelving-and-unshelving-changes.html

Чтобы проверить, эквивалентны ли выражения E_1 и E_2, нужно просто упростить левые части следующих выражений и проверить их истинность:

Кажется здесь даже не надо вычислять ни вычитание, ни деление. Правильней было бы нормализовать выражения (упростить и отсортировать внутренние слагаемые). Затем вычислить хеши, если они равны, то уже произвести сравнение деревьев этих выражений.

Я, кстати, над подобным проектом занимался, правда это было более 10 лет назад, может полезно будет: Математические выражения в .NET (разбор, дифференцирование, упрощение, дроби, компиляция)

Так shuffle - это случайная перестановка определенной последовательности, а не выбор случайной песни каждый раз.

Вроде на GitHub чистка на сервере никогда не вызывается, чтобы избежать проблему испорченных ссылок.

В официальной документации про сквош так написано:

# s, squash <commit> = use commit, but meld into previous commit

Ни о какой ветке речи не идёт.

Вообще из контекста сообщения выше понятно, что речь идёт об отдельных коммитах, а не о целой ветке:

перед мержем можно сделать рибейз и посквошить коммиты так, чтобы каждый коммит описывал одно атомарное изменение одного типа.

А я использую Shelf - так даже удобней, так как временные изменения существуют параллельно, а не последовательно, и не надо ветвь разгребать в конце.

Без GUI тоже настраивается, здесь есть описание maxVisits: https://github.com/lightvector/KataGo/blob/master/docs/Analysis_Engine.md

Это настраивается. Например, в katrain можно зайти в General & Engine Settings и выставить Maximum number of visits in analysis в 1 и попробовать сыграть. Это и будет режим чисто на предсказаниях без использования MCTS.

Согласен. То же самое можно сказать и про логарифмы, но почему-то в этой статье числа в них учитываются, хотя существует десятичный lg или натуральный ln, у которых в основании 10 и e соответственно - аналогия с корнем, у которого по-умолчанию степень 2.

Для меня это звучит как "в огороде бузина, а в Киеве дядька".

Я имею в виду, что MCTS - это по сути рандомизированный перебор, а reasoning в нейросетях (начиная с OpenAI o1) - это итеративное обдумывание, т.е. по сути тоже перебор каких-то идей. Что если сделать так, чтобы думающие нейросети перебирали множество вариаций во время ответа на вопрос о том, какой следующий ход? И это не выходит за рамки общего назначения.

И даже при этом играть напрямую с профессионалами они не могут. Требуется MCTS для очень не дешёвой проверки их рекомендаций.

Ну смотря с какими. Даже без запуска MCTS текущая версия KataGo играет на уровне выше дана только на одних лишь предсказаниях.

AlphaGo использует нейросети для оценки позиции и предсказания ходов, но рекомендации нейросети не используются в игре напрямую, а проходят проверку MCTS, с распараллеливанием и использованием значительных вычислительных мощностей. Настоящий AGI должен обходиться без таких костылей.

Ну так MCTS должен достигаться за счет reasoning, который начинает обретать популярность.

Начнём игру с напоминания о том, что такое SGF.

По моему мнению - это неудобный формат взаимодействия, прежде всего для человека. Для нейронки возможно тоже. Я бы попробовал что-то такое:

 . .  B0 .  .
 . B1 W0 B2 .
 . .  B3 .  .
 . .  .  .  .

Собственно это почти то же самое, что DeepSeek выдал после того, как его попросили об этом:

покажи как ты видишь доску, используя ascii-графику

только еще с номерами ходов.

Нет, чёрные не будут больше атаковать. Галлюцинируй дальше, дорогой силиконовый малыш!

Как можно видеть, страхи перед AGI несколько преувеличены.

Имхо, в подобных играх нужно очень сильно учитывать двухмерность, а не просто поток токенов. Но я не в курсе, есть ли нейросетки, которые сильно акцентируются на подобном моменте (возможно есть те, которые заточены на обработку таблиц?), но можно поискать. Либо еще можно попробовать представлять доску как изображение - это может помочь.

А еще можно попробовать для начала обучить движок хотя бы на правилах игры, на самых простых примерах (типа в такой ситуации нельзя ставить туда, в другой ситуации белые получают столько-то очков и т.д.). Может тоже попробую поиграться с этим, если ресурсы и время свободится.

C# практически полностью написан сам на себе: его фротенд Roslyn - полностью, его бекенд runtime - на 80%.

Почему этому постоянно уделяется столько внимания? Смысл всегда понятен с мягким знаком или без.

Вроде я уже когда-то давно читал о такой змейке.

Интересно, что у них самый большой субпиксель используется для синего цвета. Это обуславливается как-то через восприятие цвета?

KataGo может играть на среднем железе, причем играет на уровне средних топов только лишь на одних предсказаниях нейросети (это вообще без использования перебора с помощью Монте-Карло). Что касается обучения - в описании написано следующее:

If tuned well, a training run using only a single top-end consumer GPU could possibly train a bot from scratch to superhuman strength within a few months.

Это выглядит подъемно.

Но по идее последняя версия gpt-4o может "думать", итеративно отвечать на вопрос. Но не понятно, можно ли использовать это свойство для перебора позиций, типа симуляции Monte Carlo tree search.

Information

Rating
2,505-th
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity