Google выпустил предварительную версию Gemini 2.5 Flash — более быструю и гибкую версию своей облегчённой модели искусственного интеллекта. Разработчики могут попробовать её прямо сейчас через API Gemini с помощью Google AI Studio и Vertex AI. Модель также доступна пользователям в приложении Gemini. Для тестирования модели без использования VPN можно воспользоваться сайтом BotHub.

Новая версия, созданная на основе Flash 2.0, отличается более надёжной логикой и оптимизирована для повышения скорости и экономичности.
Google описывает её как гибридную модель, которая даёт разработчикам больше контроля над тем, насколько «думающей» является система. Благодаря этому контролю пользователи могут устанавливать бюджеты, чтобы сбалансировать качество, время отклика и стоимость.
Даже при отключённом «мышлении» Gemini 2.5 Flash всё равно превосходит своего предшественника. При его включении качество вывода улучшается, но цена возрастает — с 0,004 до 3,50 долларов за ответ.
Несмотря на более высокую стоимость, эта модель всё равно дешевле сопоставимых систем. Только o4-mini от OpenAI приближается к ней по соотношению цены и качества.

Выпуск Flash дополняет более широкую серию гибридных моделей логического вывода Gemini 2.5 от Google. В то время как Flash ориентирован на скорость и доступность, Gemini 2.5 Pro предназначен для более сложных задач с полномасштабным логическим выводом и мультимодальной поддержкой.
Gemini 2.5 Pro — самая мощная модель Google на сегодняшний день, лидирующая в нескольких тестах производительности. Она хорошо справляется с математическими, научными и программистскими задачами, набрав 18,8% баллов в «Последнем экзамене человечества» и 63,8% баллов в SWE-Bench Verified. Модель Pro доступна в Google AI Studio и подписчикам Gemini Advanced.
Но Gemini 2.5 Pro стоит дороже. Входные токены стоят 1,25 доллара за миллион при запросе до 200 000 токенов и 2,50 доллара при запросе свыше 200 000 токенов. Выходные токены, включая «мыслительные», стоят 10 долларов за миллион при запросе до 200 000 токенов и 15 долларов при запросе свыше 200 000 токенов.
Вместе Gemini 2.5 Flash и Pro предлагают разработчикам большую гибкость в плане скорости, стоимости и вычислительной мощности. Это часть более широкой стратегии Google по предоставлению масштабируемых вариантов ИИ для широкого спектра сценариев использования.