Комментарии 7
Лучшим убеждателем оказался GPT-5.4 (high reasoning) с показателем 1,71. Claude Opus 4.6
Claude тоже с high reasoning, как и в целом другие.
Это важное отличие, если переводите, пожалуйста не искажайте информацию
Как по мне:
Гпт 5.4 - неплохо думает, Но не так делает. Но и плохо думает в цепочках связи.
Грок до хуя пиздит как обычно, миллиард текста и воды.
Клауд тараторит как ебаная тёлка, и если на него наехать, он начинает от страха хуйню мутить.
Дипсик хорош для автоматической подачи туалетной бумаги.
Джемини уничтожит код нахуй, а потом - ой извини я гей ыыыы.
Лень расписывать.
по мне так Claude Opus думает дольше. Но и результат довольно таки хороший
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Новый бенчмарк стравил 15 моделей