
Китайская Moonshot AI выпустила Kimi K2.5 — мультимодальную модель с новым режимом Agent Swarm, в котором ИИ самостоятельно порождает до 100 параллельных субагентов и координирует до 1500 вызовов инструментов за сессию. По данным компании, это ускоряет выполнение сложных задач до 4,5 раз по сравнению с одиночным агентом.
K2.5 построена на базе предыдущей версии K2 с дообучением на 15 триллионах мультимодальных токенов. Главная техническая новинка — метод PARL (Parallel-Agent Reinforcement Learning): обучаемый оркестратор декомпозирует задачу на параллельные подзадачи и распределяет их между "замороженными" субагентами. Разработчики решили проблему "последовательного коллапса", когда модель скатывается к пошаговому выполнению вместо параллельного, — для этого ввели специальную метрику Critical Steps и поэтапное формирование награды.
Отдельный акцент — на кодинге с визуальным вводом. K2.5 умеет генерировать код по видеозаписи: в демо модель воссоздает веб-сайт, просматривая запись экрана. Также заявлен "автономный визуальный дебаггинг" — модель сама оценивает результат своей работы и итеративно его исправляет. Для разработчиков вышел Kimi Code — терминальный инструмент с открытым исходным кодом, который интегрируется с VSCode, Cursor и Zed, принимает изображения и видео на входе и автоматически импортирует MCP-конфигурации.
В режиме Thinking модель лидирует в визуальных бенчмарках: OCRBench — 92,3 (против 80,7 у GPT-5.2), InfoVQA — 92,6 (против 84,0), MathVista — 90,1 (лучший результат). При этом в "чистом" reasoning K2.5 уступает топовым конкурентам: на AIME 2025 — 96,1 против 100 у GPT-5.2, на GPQA-Diamond — 87,6 против 92,4.
Режим Agent Swarm компенсирует это отставание на практических задачах. На BrowseComp рой агентов набирает 78,4 балла против 60,6 у одиночной K2.5 и 37,0 у Claude Opus 4.5. На внутреннем бенчмарке Wide Search — 79,0 против 72,7. Moonshot заявляет экономию от 5 до 21 раза по сравнению с GPT-5.2 при сопоставимом качестве. Сценарии использования — масштабный поиск по множеству источников, генерация длинных документов, пакетная обработка. В то время как K2.5 в режимах Instant и Thinking доступна бесплатно, Agent Swarm работает по подписке от $31 в месяц.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
