Mistral представила Devstral 2 (123B параметров) и Devstral Small 2 (24B) — пару кодинговых моделей для разных сценариев. Большая набирает 72.2% на SWE-bench Verified и конкурирует с Claude Sonnet, младшая — 68% и запускается локально на на топовых GPU. Веса обеих моделей открытые.

Devstral 2 в 5 раз меньше DeepSeek V3.2 и в 8 раз меньше Kimi K2, но показывает сопоставимые результаты. В тестах живыми людьми 42.8% предпочли Devstral 2 против 28.6% за DeepSeek R1 (остальное — ничьи). Claude Sonnet 4.5 для серьезного кодинга пока выглядит предпочтительнее, но цена на эту модель в 7 раз выше.

Вместе с моделями вышел Vibe CLI — open-source терминальный агент, прямой конкурент Claude Code. Он автоматически сканирует структуру проекта и Git, поддерживает работу с несколькими файлами и интегрируется в Zed через расширение. Лицензия Apache 2.0.

Большая сейчас бесплатно доступна через API Mistral, после окончания промо-периода цена составит $0.40/$2.00 за миллион токенов (вход/выход). Младшая модель — $0.10/$0.30. Лицензии: Modified MIT для Devstral 2, Apache 2.0 для Devstral Small 2 — обе разрешают коммерческое использование.

Для желающих использовать модели локально, надо знать, что Devstral 2 требует минимум 4× H100 для развертывания. Младшая версия работает на одном GPU вроде мощных GeForce RTX. Обе модели поддерживают контекстное окно 256K токенов и могут быть дообучены под конкретные языки или корпоративные кодовые базы.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.