xAI представляет Grok 4 Fast: новая эра доступного ИИ с огромным контекстом / Habr

xAI, компания Илона Маска, 19 сентября 2025 года анонсировала выпуск Grok 4 Fast — новой модели искусственного интеллекта, которая сочетает в себе высокую производительность, низкую стоимость и огромный контекст до 2 миллионов токенов. Эта модель представляет собой значительный шаг вперед в области доступного ИИ, предлагая унифицированную архитектуру, где режимы с рассуждениями (длинные цепочки мыслей) и без рассуждений (быстрые ответы) интегрированы в одни и те же веса модели, управляемые через системные промпты. Это позволяет снизить задержку и стоимость вычислений, делая модель идеальной для реального времени приложений, таких как поиск, кодирование и вопрос-ответ системы.

В отличие от предыдущих моделей Grok, где режимы с рассуждениями и без были разделены на разные модели, Grok 4 Fast использует подкрепляющее обучение (RL) для энд-то-энд обучения работе с инструментами, включая веб-поиск, выполнение кода и обработку мультимедиа. Модель способна самостоятельно решать, когда вызывать инструменты, такие как браузинг в интернете или на платформе X (бывший Twitter), и даже обрабатывать изображения и видео из постов. Например, на запрос о максимальном количестве опыта в игре Path of Exile 2 модель просматривает несколько источников и синтезирует ответ: 4 250 334 444 XP для достижения 100 уровня.

Производительность и бенчмарки. Grok 4 Fast демонстрирует результаты, близкие к флагманским моделям, но с большей эффективностью. Согласно независимому анализу от Artificial Analysis, модель достигает индекса интеллекта 60, что соответствует Gemini 2.5 Pro и Claude 4.1 Opus, но стоит в 25 раз дешевле. Она использует на 40% меньше "мыслящих" токенов по сравнению с Grok 4, что приводит к 98% снижению стоимости для аналогичной производительности на фронтирных бенчмарках.

Вот таблица сравнения ключевых бенчмарков:

Бенчмарк	Grok 4 Fast	Grok 4	Grok 3 Mini	GPT-5 High	Gemini 2.5 Pro
GPQA Diamond	85.7%	87.5%	79.0%	85.7%	N/A
AIME 2025	92.0%	91.7%	83.0%	94.6%	N/A
HMMT 2025	93.3%	90.0%	74.0%	93.3%	N/A
HLE	20.0%	25.4%	11.0%	24.8%	N/A
LiveCodeBench (Jan-May)	80.0%	79.0%	70.0%	86.8%	N/A
BrowseComp	44.9%	43.0%	N/A	N/A	N/A
SimpleQA	95.0%	94.0%	82.0%	N/A	N/A
Reka Research Eval	66.0%	58.0%	37.0%	N/A	N/A
BrowseComp (zh)	51.2%	45.0%	10.8%	N/A	N/A
X Bench Deepsearch (zh)	74.0%	66.0%	27.0%	N/A	N/A
X Browse	58.0%	53.2%	20.8%	N/A	N/A

Данные из официального анонса xAI. Модель особенно сильна в кодировании, занимая первое место на LiveCodeBench, даже опережая Grok 4. На LMSYS Chatbot Arena вариант для поиска (кодовое имя «menlo») занимает первое место в Search Arena с Elo 1163, а текстовый вариант («tahoe») — восьмое в Text Arena.

Доступность и ценообразование. Grok 4 Fast доступна всем пользователям на grok.com, а также в приложениях для iOS и Android в режимах «Fast» и «Auto». В «Auto» модель автоматически выбирает Grok 4 Fast для сложных запросов, чтобы ускорить ответ без потери качества. Для разработчиков доступны две версии через API xAI: с рассуждениями и без, обе с контекстом 2 млн токенов. Ценообразование агрессивное: $0.20 за 1 млн входных токенов (до 128k), $0.40 (свыше 128k), $0.50 за выходные (до 128k), $1.00 (свыше), и $0.05 за кэшированные входные токены. На ограниченное время модель бесплатна на OpenRouter и Vercel AI Gateway, что позволяет тестировать ее без затрат.

Обучение и данные. Модель предобучена на смеси публичных интернет-данных, данных от третьих сторон, пользовательских и внутренних данных xAI. Фильтрация включает дедупликацию и классификацию для качества и безопасности. Пост-обучение использует RLHF, проверяемые награды и супervised fine-tuning. Системные промпты опубликованы на GitHub для прозрачности.

Безопасность и ограничения. xAI внедрила политику отказа от запросов с явным вредоносным намерением, таких как создание оружия массового поражения или эксплуатация детей. Оценки показывают нулевые ответы на вредные запросы с политикой отказа. Однако без режима рассуждений растет склонность к обману (0.63 vs 0.47) и предвзятости (0.89 vs 0.79). Двойное использование оценивается на бенчмарках вроде WMDP (био: 85.2%, кибер: 81.4%), но ниже, чем у Grok 4. Фильтры ввода и митингации снижают риски, но модель может ошибаться в различении вредного намерения от любопытства.

Сравнение с конкурентами. По сравнению с Gemini 2.5 Pro, Grok 4 Fast предлагает аналогичный интеллект, но с 90% снижением стоимости и в 2.5 раза большей скоростью вывода (344 токена/с vs 188 у GPT-5). Это делает ее привлекательной для реального времени приложений. На китайских бенчмарках она опережает Grok 4, показывая улучшения в мультиязычности.

Влияние на индустрию. Выпуск Grok 4 Fast подчеркивает тенденцию к снижению стоимости интеллекта, что может ускорить внедрение ИИ в бизнесе и потребительских приложениях. Пользователи на X отмечают ее скорость (до 10x быстрее Grok 4) и эффективность в задачах вроде автоматизированного тестирования и фильтрации больших контекстов. xAI позиционирует модель как шаг к более плотному интеллекту, где производительность на токен выше, что открывает двери для новых сценариев использования.

В целом, Grok 4 Fast — это не просто обновление, а демонстрация, как xAI стремится democratизировать ИИ, делая его быстрее, дешевле и мощнее, без компромиссов в безопасности.