Обновить

Комментарии 5

Grok победил - с задачей справился за 4 дня!

А что? Маск же заявлял что ИИ всех убет.

Точно! План перевыполнен на 11 дней раньше срока.

Учитывая, какие модели вы использовали, нужно было ещё llama 3 8B добавить, чтобы наглядней было. Гулять так гулять

Совпадает с тем, что вижу в ежедневной работе с Claude Code. У Claude есть устойчивая привычка: перед деструктивными действиями делать паузу, уточнять, предлагать обратимый вариант. Это иногда замедляет разработку, но ни разу не приводило к потере данных. С другими агентами такого не было. Похоже, выравнивание и осторожность это не отдельный режим модели, а сквозной поведенческий паттерн, который проявляется и в коде, и в симуляции.

ну у меня от клода другое впечатление, версия 4.8 у меня регулярно сваливалась в режим "на руинах старого построим счастливый мир" при этом не спрашивала, а в начале делала и потом каялась. Пришлось специально подручивать промпт. А новая версия - которая кастрированный Мифус - она продолжает тренд предыдущей, но теперь услужливо гундосит о возможных рисках и нюансах - но приходит к тому-же решению "спалить все нафиг"

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации