Как стать автором
Обновить

Mistral выпустила модели машинного обучения для кода и математики

Время на прочтение1 мин
Количество просмотров4.2K

Mistral представила модели машинного обучения MathΣtral и Codestral, предназначенные для решения математических задач и генерации кода соответственно. Обе нейросети опубликованы под лицензией Apache 2.0.

MathΣtral представляет собой базовую языковую модель Mistral 7B, дополнительно обученную на математических данных и полном курсе STEM (Science, Technology, Engineering, Mathematics). Нейросеть создавали вместе с исследователями из Project Numina, которые специализируются на разработке математических моделей.

Нейросеть Codestral предназначена для генерации кода и построена на архитектуре Mamba V2. Модель с 7 млрд параметрами бесплатная и доступна всем пользователям, также есть версия с 22 млрд параметрами, но для неё надо приобрести коммерческую лицензию.

В тестах MathΣtral превосходит другие открытые нейросети, но пока уступает проприетарным моделям машинного обучения. Codestral также не дотягивает до производительности Llama 3 8B и других закрытых моделей.

Обе нейросети открыты и доступны на платформе Hugging Face (1, 2). Там же можно найти инструкции по установке и запуску.

Теги:
Хабы:
Если эта публикация вас вдохновила и вы хотите поддержать автора — не стесняйтесь нажать на кнопку
Всего голосов 2: ↑2 и ↓0+3
Комментарии1

Другие новости

Истории

Работа

Data Scientist
95 вакансий

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн
10 – 11 октября
HR IT & Team Lead конференция «Битва за IT-таланты»
МоскваОнлайн
25 октября
Конференция по росту продуктов EGC’24
МоскваОнлайн
7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн