Grok 4 Fast — новая модель от xAI / Хабр

Команда AI for Devs подготовила перевод анонса Grok 4 Fast — новой модели xAI, которая сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98% и впервые становится доступной всем пользователям без ограничений.

Мы рады представить Grok 4 Fast — шаг вперёд в создании моделей для экономичного рассуждения. Построенная на опыте xAI с Grok 4, Grok 4 Fast обеспечивает производительность уровня передовых решений как для бизнеса, так и для конечных пользователей — при выдающейся эффективности по числу токенов. Эта модель раздвигает границы для компактных и быстрых ИИ, делая качественные рассуждения доступными большему числу пользователей и разработчиков. Grok 4 Fast предлагает передовую экономичность (SOTA), современные возможности поиска в интернете и X, контекстное окно на 2 миллиона токенов и единую архитектуру, объединяющую режимы рассуждений и прямого ответа в одной модели.

Новый уровень доступного интеллекта

Grok 4 Fast открывает новую страницу в создании доступных по стоимости систем искусственного интеллекта, опережая Grok 3 Mini на тестах на рассуждение и значительно снижая затраты на токены.

Benchmark pass@1	Grok 4 Fast	Grok 4	Grok 3 Mini (High)	GPT-5 (High)	GPT-5 Mini (High)
GPQA Diamond	85.7%	87.5%	79.0%	85.7%	82.3%
AIME 2025 (без инструментов)	92.0%	91.7%	83.0%	94.6%	91.1%
HMMT 2025 (без инструментов)	93.3%	90.0%	74.0%	93.3%	87.8%
HLE (без инструментов)	20.0%	25.4%	11.0%	24.8%	16.7%
LiveCodeBench (янв-май)	80.0%	79.0%	70.0%	86.8%	77.4%

Мы использовали масштабное обучение с подкреплением (reinforcement learning), чтобы максимально повысить «плотность интеллекта» Grok 4 Fast. В наших тестах модель показала результаты, сопоставимые с Grok 4, при этом в среднем используя на 40% меньше thinking-токенов.

Эта 40%-ная прибавка к эффективности по токенам в сочетании с заметно более низкой ценой за токен позволяет сократить стоимость достижения того же уровня на передовых бенчмарках на 98% по сравнению с Grok 4. Независимый обзор от Artificial Analysis подтвердил, что Grok 4 Fast демонстрирует лучший в своём классе показатель соотношения «цена-интеллект» среди всех публично доступных моделей на Artificial Analysis Intelligence Index.

Нативная работа с инструментами и передовой поиск

Grok 4 Fast обучался по схеме end-to-end с использованием обучения с подкреплением (RL), специально ориентированного на работу с инструментами. Он отлично справляется с задачей выбора момента, когда нужно вызвать инструмент — например, выполнить код или открыть браузер.

Grok 4 Fast демонстрирует передовые агентные возможности поиска: он легко серфит веб и X, дополняя запросы актуальными данными в реальном времени. Модель умеет переходить по ссылкам, обрабатывать медиа (включая изображения и видео на X) и синтезировать результаты с молниеносной скоростью.

Benchmark pass@1	Grok 4 Fast	Grok 4	Grok 3 (без рассуждений)
BrowseComp	44.9%	43.0%	—
SimpleQA	95.0%	94.0%	82.0%
Reka Research Eval	66.0%	58.0%	37.0%
BrowseComp (zh)	51.2%	45.0%	10.8%
X Bench Deepsearch (zh)	74.0%	66.0%	27.0%
X Browse*	58.0%	53.2%	20.8%

*X Browse — внутренний бенчмарк, оценивающий многошаговый поиск и возможности навигации агента в X.

Передовой уровень общего пост-тренинга

Grok 4 Fast также задаёт новую планку эффективности в решении задач общего назначения. Мы рады поделиться результатами модели на LMArena, где она проходила закрытое тестирование в Search и Text Arena.

В Search Arena LMArena модель grok-4-fast-search (кодовое имя: menlo) заняла первое место с результатом 1163 Elo, опередив ближайшего конкурента o3-search на 17 пунктов. Высокая эффективность рассуждений и «плотность интеллекта» позволяют Grok 4 Fast обгонять гораздо более крупные модели в реальных задачах, связанных с поиском.

Единая модель: рассуждения и быстрые ответы

Раньше для режима рассуждений и для быстрых ответов использовались разные модели. Grok 4 Fast представляет единую архитектуру, в которой рассуждения (длинные цепочки мыслей) и короткие ответы обрабатываются одними и теми же весами модели, а поведение настраивается с помощью системных промтов. Такой подход снижает полную задержку ответа и уменьшает количество токенов, делая Grok 4 Fast отличным решением для задач, требующих реакции в реальном времени.

На grok.com это выражается в плавных переходах: для простых запросов модель отвечает мгновенно, а для сложных включает расширенный режим рассуждений. В API xAI разработчики могут гибко настраивать это поведение, выбирая баланс между скоростью и глубиной.

Grok 4 Fast уже доступен всем пользователям. В режимах Fast и Auto вы заметите значительное ускорение поиска и получения информации. Кроме того, для сложных запросов в Auto-режиме будет использоваться именно Grok 4 Fast, что обеспечит гораздо более быструю работу без потери качества. Впервые все пользователи, включая бесплатных, получили доступ к нашей последней модели без ограничений — важный шаг к демократизации продвинутого ИИ.

Grok 4 Fast на OpenRouter, Vercel AI Gateway и в xAI API

Ограниченное время Grok 4 Fast будет доступен бесплатно на OpenRouter и Vercel AI Gateway.

Мы также выпускаем Grok 4 Fast в виде двух моделей:

grok-4-fast-reasoning
grok-4-fast-non-reasoning

Каждая из них поддерживает контекстное окно в 2 млн токенов. Это позволяет разработчикам тонко настраивать вычислительные ресурсы под конкретные сценарии.

Цены на использование grok-4-fast-reasoning и grok-4-fast-non-reasoning в xAI API:

Тип токена	<128k токенов	≥128k токенов
Входные токены	$0.20 / 1M	$0.40 / 1M
Выходные токены	$0.50 / 1M	$1.00 / 1M
Кэшированные входные токены	$0.05 / 1M	—

Русскоязычное сообщество про AI в разработке

Друзья! Эту статью перевела команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!

Grok 4 Fast — новая модель от xAI