Французский стартап Mistral, занимающийся искусственным интеллектом, выпустил Devstral Small 24B — новую языковую модель с открытым исходным кодом, созданную для разработки программного обеспечения и названную «агентной».

Разработанный в сотрудничестве с All Hands AI, Devstral выпущен под лицензией Apache 2.0 и установил новый рекорд для открытых моделей в тесте SWE-Bench Verified, набрав 46,8%. В тесте SWE-Bench Verified используется набор данных из 500 реальных, проверенных вручную проблем на GitHub.
По словам Mistral, этот результат ставит Devstral выше как Deepseek-V3, так и Gemma 3 от Google. Devstral заменяет предыдущую модель Mistral — Codestral, которая не была доступна для коммерческого использования. Mistral заявляет, что Devstral разработан для интеграции в различные среды разработки, включая плагины и инструменты разработки.
Ожидается, что в ближайшие недели появится более крупная версия модели.

По сравнению с проприетарными моделями Devstral также работает значительно лучше, опережая недавно выпущенный GPT-4.1-mini более чем на 20 процентов, по данным компании. Mistral отмечает, что Devstral — это «предварительная исследовательская версия», и компания будет рада отзывам.
Devstral оптимизирован для локального запуска на системах с графическим процессором RTX 4090 или Mac с 32 ГБ оперативной памяти и поддерживает такие инструменты, как OpenHands и SWE-Agent. Модель доступна на Hugging Face, Ollama, Kaggle, LM Studio и через собственный API Mistral. Стоимость составляет 0,10 доллара за миллион входных токенов.
Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!