Pull to refresh

Comments 13

Если у вас есть опыт общения с клодом и у вас есть информация для сравнения с гуглловским сервисом, буду очень признателен в вашей оценки в их сравнении.

Claude 3.5 хороша в коде, архитектуре, в том числе в длинном диалоге шагов на 15 уточнения задачи. Из минусов: она гиперадаптивна и во всём соглашается. Очень жду 3.5 Opus

Гугл последние модели стали хорошо кодировать. Один недостаток: очень многословен и не умеет продолжать код который не поместился в прошлый вывод. Поэтому, на втором месте.

За 3е место в моём личном зачёте борются grok 2 и llama 3.3

Chatgpt o1 не могу протестировать. 4о ну так себе...

Ну и внизу списка, но ещё приемлемая это mistral. Преимущество: сайт доступен из РФ без VPN и иных извращений

Держите нас в курсе, но почему бы не написать, согласно правилам Хабра, не твит, а пост, интересный для аудитории, а не только для посвященных?

Раз в месяц пробую Gemini на простых задачках и он постоянно тупее GPT-4o. В чем профит?

Все субъективно, в моем случае Gemini справляется куда лучше, чем GPT-4o и менее зацензурен, в частности касается обработки фото людей.

Согласен, почему то он часто не учитывает контекст и делает ошибки в коде чаще GPT4o и как будто даже GPT3T

В чем-то соглашусь. На моих задачах Gemini (gemini-pro) хуже следует системным инструкциям, чем gpt-4o. А также показывает меньшую глубину понимания запросов. И на простых тасках это заметно. Но вот в сложных запросах качество ответов gpt-4o тоже падает и доходит до того же уровня. Однако у gemini-pro есть неоспоримый плюс в виде 2-х миллионного контекстного окна, что в моем случае оказалось одним из решающих факторов.

Качество пока не оценивал.

Товар получил, всё ок, ещё не распаковывал. Продавца рекомендую.

Сравнивал с o1 mini, o1 и gemini 1206, так вот по кодингу(брал задачки с codewars, и свои примеры) o1 и gemini 1206 решают хорошо, o1 mini допускала ошибки. Какие ограничение у aistudio google ? Есть ли они там или лимит только на API ?

Я думаю (но точно не знаю), студия - это обертка над АПИ. Так что лимит у них наверно общий.

Точно не общий. Через бесплатное апи вообще не дают контекст больше чем 128к. Ну по крайней мере запросы с текстом размером больше 300к символов не проходят.

Такой большой запрос наверно лучше через аплоад файла, а не прямо в запросе. У меня есть под рукой свежий пример инпута 347к токенов через апи флэш 2. Основной пэйлоад - пдф.

Но, да, сбои могут быть. Нужно иногда переинициализировать модель.

Sign up to leave a comment.

Other news