Команда AI for Devs подготовила перевод анонса Grok 4 Fast — новой модели xAI, которая сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98% и впервые становится доступной всем пользователям без ограничений.
Мы рады представить Grok 4 Fast — шаг вперёд в создании моделей для экономичного рассуждения. Построенная на опыте xAI с Grok 4, Grok 4 Fast обеспечивает производительность уровня передовых решений как для бизнеса, так и для конечных пользователей — при выдающейся эффективности по числу токенов. Эта модель раздвигает границы для компактных и быстрых ИИ, делая качественные рассуждения доступными большему числу пользователей и разработчиков. Grok 4 Fast предлагает передовую экономичность (SOTA), современные возможности поиска в интернете и X, контекстное окно на 2 миллиона токенов и единую архитектуру, объединяющую режимы рассуждений и прямого ответа в одной модели.
Новый уровень доступного интеллекта
Grok 4 Fast открывает новую страницу в создании доступных по стоимости систем искусственного интеллекта, опережая Grok 3 Mini на тестах на рассуждение и значительно снижая затраты на токены.
Benchmark pass@1 | Grok 4 Fast | Grok 4 | Grok 3 Mini (High) | GPT-5 (High) | GPT-5 Mini (High) |
|---|---|---|---|---|---|
GPQA Diamond | 85.7% | 87.5% | 79.0% | 85.7% | 82.3% |
AIME 2025 (без инструментов) | 92.0% | 91.7% | 83.0% | 94.6% | 91.1% |
HMMT 2025 (без инструментов) | 93.3% | 90.0% | 74.0% | 93.3% | 87.8% |
HLE (без инструментов) | 20.0% | 25.4% | 11.0% | 24.8% | 16.7% |
LiveCodeBench (янв-май) | 80.0% | 79.0% | 70.0% | 86.8% | 77.4% |
Мы использовали масштабное обучение с подкреплением (reinforcement learning), чтобы максимально повысить «плотность интеллекта» Grok 4 Fast. В наших тестах модель показала результаты, сопоставимые с Grok 4, при этом в среднем используя на 40% меньше thinking-токенов.

Эта 40%-ная прибавка к эффективности по токенам в сочетании с заметно более низкой ценой за токен позволяет сократить стоимость достижения того же уровня на передовых бенчмарках на 98% по сравнению с Grok 4. Независимый обзор от Artificial Analysis подтвердил, что Grok 4 Fast демонстрирует лучший в своём классе показатель соотношения «цена-интеллект» среди всех публично доступных моделей на Artificial Analysis Intelligence Index.

Нативная работа с инструментами и передовой поиск
Grok 4 Fast обучался по схеме end-to-end с использованием обучения с подкреплением (RL), специально ориентированного на работу с инструментами. Он отлично справляется с задачей выбора момента, когда нужно вызвать инструмент — например, выполнить код или открыть браузер.
Grok 4 Fast демонстрирует передовые агентные возможности поиска: он легко серфит веб и X, дополняя запросы актуальными данными в реальном времени. Модель умеет переходить по ссылкам, обрабатывать медиа (включая изображения и видео на X) и синтезировать результаты с молниеносной скоростью.
Benchmark pass@1 | Grok 4 Fast | Grok 4 | Grok 3 (без рассуждений) |
|---|---|---|---|
BrowseComp | 44.9% | 43.0% | — |
SimpleQA | 95.0% | 94.0% | 82.0% |
Reka Research Eval | 66.0% | 58.0% | 37.0% |
BrowseComp (zh) | 51.2% | 45.0% | 10.8% |
X Bench Deepsearch (zh) | 74.0% | 66.0% | 27.0% |
X Browse* | 58.0% | 53.2% | 20.8% |
*X Browse — внутренний бенчмарк, оценивающий многошаговый поиск и возможности навигации агента в X.
Передовой уровень общего пост-тренинга
Grok 4 Fast также задаёт новую планку эффективности в решении задач общего назначения. Мы рады поделиться результатами модели на LMArena, где она проходила закрытое тестирование в Search и Text Arena.
В Search Arena LMArena модель grok-4-fast-search (кодовое имя: menlo) заняла первое место с результатом 1163 Elo, опередив ближайшего конкурента o3-search на 17 пунктов. Высокая эффективность рассуждений и «плотность интеллекта» позволяют Grok 4 Fast обгонять гораздо более крупные модели в реальных задачах, связанных с поиском.
Единая модель: рассуждения и быстрые ответы
Раньше для режима рассуждений и для быстрых ответов использовались разные модели. Grok 4 Fast представляет единую архитектуру, в которой рассуждения (длинные цепочки мыслей) и короткие ответы обрабатываются одними и теми же весами модели, а поведение настраивается с помощью системных промтов. Такой подход снижает полную задержку ответа и уменьшает количество токенов, делая Grok 4 Fast отличным решением для задач, требующих реакции в реальном времени.
На grok.com это выражается в плавных переходах: для простых запросов модель отвечает мгновенно, а для сложных включает расширенный режим рассуждений. В API xAI разработчики могут гибко настраивать это поведение, выбирая баланс между скоростью и глубиной.
Grok 4 Fast уже доступен всем пользователям. В режимах Fast и Auto вы заметите значительное ускорение поиска и получения информации. Кроме того, для сложных запросов в Auto-режиме будет использоваться именно Grok 4 Fast, что обеспечит гораздо более быструю работу без потери качества. Впервые все пользователи, включая бесплатных, получили доступ к нашей последней модели без ограничений — важный шаг к демократизации продвинутого ИИ.
Grok 4 Fast на OpenRouter, Vercel AI Gateway и в xAI API
Ограниченное время Grok 4 Fast будет доступен бесплатно на OpenRouter и Vercel AI Gateway.
Мы также выпускаем Grok 4 Fast в виде двух моделей:
grok-4-fast-reasoning
grok-4-fast-non-reasoning
Каждая из них поддерживает контекстное окно в 2 млн токенов. Это позволяет разработчикам тонко настраивать вычислительные ресурсы под конкретные сценарии.
Цены на использование grok-4-fast-reasoning и grok-4-fast-non-reasoning в xAI API:
Тип токена | <128k токенов | ≥128k токенов |
|---|---|---|
Входные токены | $0.20 / 1M | $0.40 / 1M |
Выходные токены | $0.50 / 1M | $1.00 / 1M |
Кэшированные входные токены | $0.05 / 1M | — |
Русскоязычное сообщество про AI в разработке

Друзья! Эту статью перевела команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!
