Обновить

Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели8.8K
Всего голосов 2: ↑1 и ↓10
Комментарии5

Комментарии 5

DeepSeek V4 Flash лучше Gemma на 0.58, в 5-10 раз дороже в эксплуатации

Вы же использовали OpenRouter ?

https://openrouter.ai/google/gemma-4-31b-it
https://openrouter.ai/deepseek/deepseek-v4-flash

 DeepSeek V4 Flash просто сразу дешевле Gemma 4 31B.
А с учётом процента кэширования входящих промтов (провайдер DeepSeek, вкладка Pricing) ваш вывод будет верен с точностью до наоборот - в диалогах DeepSeek V4 Flash в 5-10 раз дешевле чем Gemma 4 31B :)

Добрый день

Спасибо, вы правы, в использовании через OR цена на 1М токенов - в пользу Дипсик, в моем случае речь идет о локальном инференсе, так как модели должны быть развернуты в локальном контуре или в приватном облаке с безопасным доступом, чтобы не допустить утечек данных.

Попробуйте Gemini 3.1 Flash Lite, очень мощная и очень дешевая, гораздо дешевле того же дипсика.

Спасибо, про Gemini (начиная с версии 3) - однозначно согласен, очень нравится модель для использования в задачах, где можно пользоваться облаком. В нашем случае важно развертывание под клиента, который работает на территории РФ в соответствии с текущими требованиями по обработке данных.

Почему 3.5 когда вышла версия уже 3.6, и 3.7 на подходе

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации