xAI раскрыли лучшие результаты Grok 4.1 Fast и подробнее рассказали про Agent Tools API / Хабр

После недавнего релиза Grok 4.1 Fast команда xAI поделилась, по всей видимости, самыми впечатляющими результатами бенчмарков, на котор��х новая модель уверенно обходит конкурентов. Помимо этого, разработчики подробнее рассказали об инфраструктуре Agent Tools API — ключевом элементе для построения продвинутых автономных агентов.

Grok 4.1 Fast на лидирующих позициях

xAI раскрыли обновлённые данные по бенчмаркам, где Grok 4.1 Fast показывает особенно сильные результаты.

τ²-bench Telecom: 100% — максимальный результат среди агентных моделей, ориентированных на использование инструментов. Модель существенно опережает Grok 4, GPT-5.1 и Claude Sonnet 4.5.
Berkeley Function Calling v4: 72% точности при низкой стоимости, что выводит Grok 4.1 Fast в лидеры по качеству обычного и рассуждающего tool calling.
Длинный контекст: благодаря RL-обучению на долгих цепочках модель сохраняет стабильное качество вплоть до полного 2-миллионного контекстного окна. Для сравнения: в режиме с несколькими шагами «длинный контекст» Grok 4.1 Fast достигает 67% против 22% у Grok 4.

Судя по представленным данным, xAI сделали ставку на демонстрацию именно тех метрик, которые подчёркивают сильные стороны Grok 4.1 Fast как агентной платформы: стабильность, масштабируемость и точность при планировании сложных действий.

Agent Tools API — серверные инструменты для автономных агентов

Разработчики также раскрыли дополнительные подробности об Agent Tools API — наборе серверных инструментов, которые дают Grok доступ к реальным данным и внешним операциям.

API позволяет агенту:

выполнять веб-поиск и искать информацию в X в реальном времени,
запускать Python-код в безопасной среде,
обращаться к загруженным документам с интеллектуальным поиском,
подключаться к внешним MCP-серверам (например, кастомным корпоративным инструментам),
автоматически комбинировать несколько инструментов в цепочке действий.

Ключевая особенность — инструменты работают полностью на инфраструктуре xAI. Разработчикам не нужно управлять ключами, лимитами или окружениями: Grok сам решает, какой инструмент вызвать и как спланировать последовательность шагов, вплоть до параллельных вызовов.

Доступность

Сейчас xAI предлагают два варианта модели:

grok-4-1-fast-reasoning — для задач, требующих глубоких рассуждений,
grok-4-1-fast-non-reasoning — для мгновенных ответов.

До 3 декабря модель доступна бесплатно на OpenRouter, а инструменты Agent Tools API — бесплатно для всех пользователей xAI.

Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!