
xAI, компания Илона Маска, 19 сентября 2025 года анонсировала выпуск Grok 4 Fast — новой модели искусственного интеллекта, которая сочетает в себе высокую производительность, низкую стоимость и огромный контекст до 2 миллионов токенов. Эта модель представляет собой значительный шаг вперед в области доступного ИИ, предлагая унифицированную архитектуру, где режимы с рассуждениями (длинные цепочки мыслей) и без рассуждений (быстрые ответы) интегрированы в одни и те же веса модели, управляемые через системные промпты. Это позволяет снизить задержку и стоимость вычислений, делая модель идеальной для реального времени приложений, таких как поиск, кодирование и вопрос-ответ системы.
В отличие от предыдущих моделей Grok, где режимы с рассуждениями и без были разделены на разные модели, Grok 4 Fast использует подкрепляющее обучение (RL) для энд-то-энд обучения работе с инструментами, включая веб-поиск, выполнение кода и обработку мультимедиа. Модель способна самостоятельно решать, когда вызывать инструменты, такие как браузинг в интернете или на платформе X (бывший Twitter), и даже обрабатывать изображения и видео из постов. Например, на запрос о максимальном количестве опыта в игре Path of Exile 2 модель просматривает несколько источников и синтезирует ответ: 4 250 334 444 XP для достижения 100 уровня.
Производительность и бенчмарки. Grok 4 Fast демонстрирует результаты, близкие к флагманским моделям, но с большей эффективностью. Согласно независимому анализу от Artificial Analysis, модель достигает индекса интеллекта 60, что соответствует Gemini 2.5 Pro и Claude 4.1 Opus, но стоит в 25 раз дешевле. Она использует на 40% меньше "мыслящих" токенов по сравнению с Grok 4, что приводит к 98% снижению стоимости для аналогичной производительности на фронтирных бенчмарках.
Вот таблица сравнения ключевых бенчмарков:
Бенчмарк | Grok 4 Fast | Grok 4 | Grok 3 Mini | GPT-5 High | Gemini 2.5 Pro |
---|---|---|---|---|---|
GPQA Diamond | 85.7% | 87.5% | 79.0% | 85.7% | N/A |
AIME 2025 | 92.0% | 91.7% | 83.0% | 94.6% | N/A |
HMMT 2025 | 93.3% | 90.0% | 74.0% | 93.3% | N/A |
HLE | 20.0% | 25.4% | 11.0% | 24.8% | N/A |
LiveCodeBench (Jan-May) | 80.0% | 79.0% | 70.0% | 86.8% | N/A |
BrowseComp | 44.9% | 43.0% | N/A | N/A | N/A |
SimpleQA | 95.0% | 94.0% | 82.0% | N/A | N/A |
Reka Research Eval | 66.0% | 58.0% | 37.0% | N/A | N/A |
BrowseComp (zh) | 51.2% | 45.0% | 10.8% | N/A | N/A |
X Bench Deepsearch (zh) | 74.0% | 66.0% | 27.0% | N/A | N/A |
X Browse | 58.0% | 53.2% | 20.8% | N/A | N/A |
Данные из официального анонса xAI. Модель особенно сильна в кодировании, занимая первое место на LiveCodeBench, даже опережая Grok 4. На LMSYS Chatbot Arena вариант для поиска (кодовое имя «menlo») занимает первое место в Search Arena с Elo 1163, а текстовый вариант («tahoe») — восьмое в Text Arena.
Доступность и ценообразование. Grok 4 Fast доступна всем пользователям на grok.com, а также в приложениях для iOS и Android в режимах «Fast» и «Auto». В «Auto» модель автоматически выбирает Grok 4 Fast для сложных запросов, чтобы ускорить ответ без потери качества. Для разработчиков доступны две версии через API xAI: с рассуждениями и без, обе с контекстом 2 млн токенов. Ценообразование агрессивное: $0.20 за 1 млн входных токенов (до 128k), $0.40 (свыше 128k), $0.50 за выходные (до 128k), $1.00 (свыше), и $0.05 за кэшированные входные токены. На ограниченное время модель бесплатна на OpenRouter и Vercel AI Gateway, что позволяет тестировать ее без затрат.
Обучение и данные. Модель предобучена на смеси публичных интернет-данных, данных от третьих сторон, пользовательских и внутренних данных xAI. Фильтрация включает дедупликацию и классификацию для качества и безопасности. Пост-обучение использует RLHF, проверяемые награды и супervised fine-tuning. Системные промпты опубликованы на GitHub для прозрачности.
Безопасность и ограничения. xAI внедрила политику отказа от запросов с явным вредоносным намерением, таких как создание оружия массового поражения или эксплуатация детей. Оценки показывают нулевые ответы на вредные запросы с политикой отказа. Однако без режима рассуждений растет склонность к обману (0.63 vs 0.47) и предвзятости (0.89 vs 0.79). Двойное использование оценивается на бенчмарках вроде WMDP (био: 85.2%, кибер: 81.4%), но ниже, чем у Grok 4. Фильтры ввода и митингации снижают риски, но модель может ошибаться в различении вредного намерения от любопытства.
Сравнение с конкурентами. По сравнению с Gemini 2.5 Pro, Grok 4 Fast предлагает аналогичный интеллект, но с 90% снижением стоимости и в 2.5 раза большей скоростью вывода (344 токена/с vs 188 у GPT-5). Это делает ее привлекательной для реального времени приложений. На китайских бенчмарках она опережает Grok 4, показывая улучшения в мультиязычности.

Влияние на индустрию. Выпуск Grok 4 Fast подчеркивает тенденцию к снижению стоимости интеллекта, что может ускорить внедрение ИИ в бизнесе и потребительских приложениях. Пользователи на X отмечают ее скорость (до 10x быстрее Grok 4) и эффективность в задачах вроде автоматизированного тестирования и фильтрации больших контекстов. xAI позиционирует модель как шаг к более плотному интеллекту, где производительность на токен выше, что открывает двери для новых сценариев использования.
В целом, Grok 4 Fast — это не просто обновление, а демонстрация, как xAI стремится democratизировать ИИ, делая его быстрее, дешевле и мощнее, без компромиссов в безопасности.