daniel_ivanov18 мая в 12:23

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Средний

14 мин

9.5K

Искусственный интеллектМашинное обучение * Open source * Тестирование IT-систем *

Кейс

Комментарии 5

Dreams_and_magic 18 мая в 12:50

DeepSeek V4 Flash лучше Gemma на 0.58, в 5-10 раз дороже в эксплуатации

Вы же использовали OpenRouter ?

https://openrouter.ai/google/gemma-4-31b-it
https://openrouter.ai/deepseek/deepseek-v4-flash

DeepSeek V4 Flash просто сразу дешевле Gemma 4 31B.
А с учётом процента кэширования входящих промтов (провайдер DeepSeek, вкладка Pricing) ваш вывод будет верен с точностью до наоборот - в диалогах DeepSeek V4 Flash в 5-10 раз дешевле чем Gemma 4 31B :)

daniel_ivanov 18 мая в 14:25

Добрый день

Спасибо, вы правы, в использовании через OR цена на 1М токенов - в пользу Дипсик, в моем случае речь идет о локальном инференсе, так как модели должны быть развернуты в локальном контуре или в приватном облаке с безопасным доступом, чтобы не допустить утечек данных.

house2008 18 мая в 13:58

Попробуйте Gemini 3.1 Flash Lite, очень мощная и очень дешевая, гораздо дешевле того же дипсика.

daniel_ivanov 18 мая в 14:27

Спасибо, про Gemini (начиная с версии 3) - однозначно согласен, очень нравится модель для использования в задачах, где можно пользоваться облаком. В нашем случае важно развертывание под клиента, который работает на территории РФ в соответствии с текущими требованиями по обработке данных.

Mersavets 19 мая в 07:39

Почему 3.5 когда вышла версия уже 3.6, и 3.7 на подходе

Зарегистрируйтесь на Хабре, чтобы оставить комментарий