Как стать автором
Обновить

Тест-драйв Claude 4: Opus и Sonnet в бою за код и 3D

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров6.1K
Всего голосов 26: ↑24 и ↓2+25
Комментарии6

Комментарии 6

Как я понимаю из 2 моделей Claude Sonnet 4 и Opus 4 первую можно попробовать бесплатно А вот вторую только за деньги. Им бы дать некоторое количество бесплатных запросов.

Чтобы пользователи видели разницу. Я бы еще Gemini добавил для сравнения. Как я понимаю оригинал запроса на английском языке ?

Да, тоже в какой-то момент захотелось добавить Gemini 2.5 Pro. Попробую уделить больше внимания этой модели в следующий раз.

Все запросы были заданы на русском, ведь для сегодняшних крупных моделей не составляет труда понимание нюансов разных языков. Промты приведены в идентичном виде, как я их писал в интерфейсе чат-бота.

С учётом того, насколько криво у них все работает, несколько бесплатных запросов мало что дадут. Особенно радует ошибка request timeout, после которой пропадает ВСЕ, что модель успела сгенерировать за это время, и нужно отправить запрос ещё раз. При этом все то, что успешно пропало, учитывается в лимите использования

Честно говоря , вообще по текстовым задачам не вижу разницы между sonnet 4, opus 4 и старой версией 3.7. возможно sonnet 4 на 10-15% получше пишет, но в целом это не существенно. Opus 4 даже немного хуже, пытаясь "очеловечить" текст тол ко портит. В обще вообще не сильно понятно, в чем улучшение. В chatgpt намного заметнее разница между о1, o3 и 04 mini hight.

Я много тестировал эти модели для текстов, и пришел к мнению, что для этого лучше всего подходит sonnet 4 с отключённой функцией thinking

Буквально недавно делал сравнение 6 моделей

Топ 3 у гпт и топ 3 у антропика

Опус очень быстро токены ест и аккаунт в лимиты кидает

https://habr.com/ru/posts/917026/

Но результаты того стоят

Зарегистрируйтесь на Хабре, чтобы оставить комментарий