Обновить

Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге)

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели5.4K
Всего голосов 4: ↑4 и ↓0+4
Комментарии5

Комментарии 5

а минусы будут?

Инструмент должен быть инструментом. Бесспорно что подкрученные для эмоций модели так же нужны, особенно для "простых пользователей" но в работе важнее детерминированность чем эмоции

Я наоборот жду что бы это стало нормальной практикой, что бы задавая вопрос нейронке я был уверен в повторяемости результата, ведь повторяемость ведет к истинности

Все так, лучше модель которая хороша в чем-то одном, чем одинаково фигово справляется со всем, тащемта тут это как у людей работает (хотя даже узкоспециализированные модели все равно довольно универсальны относительно людей)

"Если вам нужно парсить логи или вызывать bash скрипты используйте "  DeepSeek: DeepSeek V4 Flash, Qwen: Qwen3.6 Flash, Xiaomi: MiMo-V2-Flash, StepFun: Step 3.5 Flash, Tencent: Hy3 preview, inclusionAI: Ling-2.6-flash, Poolside: Laguna XS.2 и тому подобное :)

Можете минусить сколько угодно и сливать карму, но 2026 год - это определённо год моделей с приставкой "Flash". Они для рутинных операций вполне пригодны и на порядок дешевле полных моделей. А из полных моделей уже хороши Qwen и DeepSeek - с учётом кэширования они в 10-50 раз дешевле флагманов, а отстают не в 10 раз :)

Восстановил справедливость - хз за шо вообще здесь минус был, просто агентские легковесные модели порекомендовали

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации