AlexanderAnisimov Dec 8 2024 at 14:00

Google выпустила новую модель Gemini Experimental 1206

1 min

Comments 13

Kwentin3 Dec 8 2024 at 17:40

Если у вас есть опыт общения с клодом и у вас есть информация для сравнения с гуглловским сервисом, буду очень признателен в вашей оценки в их сравнении.

Dhwtj Dec 11 2024 at 20:17

Claude 3.5 хороша в коде, архитектуре, в том числе в длинном диалоге шагов на 15 уточнения задачи. Из минусов: она гиперадаптивна и во всём соглашается. Очень жду 3.5 Opus

Гугл последние модели стали хорошо кодировать. Один недостаток: очень многословен и не умеет продолжать код который не поместился в прошлый вывод. Поэтому, на втором месте.

За 3е место в моём личном зачёте борются grok 2 и llama 3.3

Chatgpt o1 не могу протестировать. 4о ну так себе...

Ну и внизу списка, но ещё приемлемая это mistral. Преимущество: сайт доступен из РФ без VPN и иных извращений

achekalin Dec 8 2024 at 19:41

Держите нас в курсе, но почему бы не написать, согласно правилам Хабра, не твит, а пост, интересный для аудитории, а не только для посвященных?

Dee3 Dec 8 2024 at 20:24

Раз в месяц пробую Gemini на простых задачках и он постоянно тупее GPT-4o. В чем профит?

fire64 Dec 8 2024 at 21:42

Все субъективно, в моем случае Gemini справляется куда лучше, чем GPT-4o и менее зацензурен, в частности касается обработки фото людей.

Fqyeh29 Dec 9 2024 at 06:01

Согласен, почему то он часто не учитывает контекст и делает ошибки в коде чаще GPT4o и как будто даже GPT3T

AlexanderAnisimov Dec 9 2024 at 07:05

Ответил апдейтом в основном тексте новости

Per_Ardua Dec 9 2024 at 18:20

В чем-то соглашусь. На моих задачах Gemini (gemini-pro) хуже следует системным инструкциям, чем gpt-4o. А также показывает меньшую глубину понимания запросов. И на простых тасках это заметно. Но вот в сложных запросах качество ответов gpt-4o тоже падает и доходит до того же уровня. Однако у gemini-pro есть неоспоримый плюс в виде 2-х миллионного контекстного окна, что в моем случае оказалось одним из решающих факторов.

Hardcoin Dec 8 2024 at 22:00

Качество пока не оценивал.

Товар получил, всё ок, ещё не распаковывал. Продавца рекомендую.

Shurik911 Dec 17 2024 at 14:23

Сравнивал с o1 mini, o1 и gemini 1206, так вот по кодингу(брал задачки с codewars, и свои примеры) o1 и gemini 1206 решают хорошо, o1 mini допускала ошибки. Какие ограничение у aistudio google ? Есть ли они там или лимит только на API ?

AlexanderAnisimov Dec 17 2024 at 14:35

Я думаю (но точно не знаю), студия - это обертка над АПИ. Так что лимит у них наверно общий.

poro_ku Dec 18 2024 at 02:55

Точно не общий. Через бесплатное апи вообще не дают контекст больше чем 128к. Ну по крайней мере запросы с текстом размером больше 300к символов не проходят.

AlexanderAnisimov Dec 18 2024 at 05:44

Такой большой запрос наверно лучше через аплоад файла, а не прямо в запросе. У меня есть под рукой свежий пример инпута 347к токенов через апи флэш 2. Основной пэйлоад - пдф.

Но, да, сбои могут быть. Нужно иногда переинициализировать модель.