Стартап Mistral AI из Франции выпустил Codestral — свою первую модель машинного обучения для генерации кода. Нейросеть обучили на 80 языках программирования, включая JavaScript, Python и Java.
![](https://habrastorage.org/getpro/habr/upload_files/278/d80/304/278d803046bac7014a78953bb0ece3da.jpg)
У Codestral 22 млрд параметров, что обеспечивает достаточную производительность для быстро генерации. Нейросеть справляется с созданием программного кода с нуля и заполнения пробелов. Кроме того, Codestral может отвечать на вопросы по кодовой базе проекта и писать тесты.
В датасет входили как популярные языки программирования, так и менее распространённые, к примеру, Swift и Fortran. Команда стартапа изначально пыталась охватить как можно больше технологий, чтобы нейросетью могли пользоваться разные разработчики. Также Codestral может составлять SQL-запросы и генерировать Bash-скрипты.
![](https://habrastorage.org/getpro/habr/upload_files/401/ff6/e72/401ff6e727747fbbf32842ef54c6dced.jpg)
Модель частично открыта и надо соблюдать определённые условия. Нейросеть нельзя использовать в коммерческой деятельности. В пользовательском соглашении это прямо прописано. Вероятно, что модель частично обучали на данных, защищённых авторским правом.
![](https://habrastorage.org/getpro/habr/upload_files/1e2/f0c/45b/1e2f0c45b56f3e1ab980555defc2f2a2.png)
Codestral с весами опубликована на платформе Hugging Face. Также бесплатно пользоваться моделью можно на портале Le Chat.