runaway_llm27 мар в 20:00

Кто убедительнее — GPT-5.4 или Claude Opus 4.6? Новый бенчмарк стравил 15 моделей

2 мин

11K

Комментарии 7

Лучшим убеждателем оказался GPT-5.4 (high reasoning) с показателем 1,71. Claude Opus 4.6

Claude тоже с high reasoning, как и в целом другие.

Это важное отличие, если переводите, пожалуйста не искажайте информацию

Если присмотреться к картинке, там опус 4.6 тоже с high reasoning, правда слово «reasoning» не влезло

Opus high reasoning часто уходит в аналитический паралич. Перестал им пользоваться

Как это проявляется?

Рассуждения раз в 5 дольше чем надо по смыслу и изредка стоп без ответа.

Как по мне:

Гпт 5.4 - неплохо думает, Но не так делает. Но и плохо думает в цепочках связи.

Грок до хуя пиздит как обычно, миллиард текста и воды.

Клауд тараторит как ебаная тёлка, и если на него наехать, он начинает от страха хуйню мутить.

Дипсик хорош для автоматической подачи туалетной бумаги.

Джемини уничтожит код нахуй, а потом - ой извини я гей ыыыы.

по мне так Claude Opus думает дольше. Но и результат довольно таки хороший

Зарегистрируйтесь на Хабре, чтобы оставить комментарий