Mistral выпустила модель Large 3 675B и девять версий Ministral 3 (3B/8B/14B × Base/Instruct/Reasoning) / Хабр

Французский стартап Mistral во вторник представил семейство моделей Mistral 3.

В релиз вошли десять моделей: одна крупная, оснащённая мультимодальными и многоязычными возможностями; а также девять компактных офлайн‑версий, которые можно кастомизировать под задачи заказчика.

Первые бенчмарки, где компактные модели Mistral заметно уступают закрытым конкурентам, могут ввести в заблуждение, отмечает он. Крупные закрытые модели и правда выглядят лучше «из коробки», но настоящие преимущества проявляются только при файнтюнинге.

Флагманская модель, получившая название Mistral Large 3, вплотную подбирается к возможностям крупных закрытых систем вроде ChatGPT 4o от OpenAI и Gemini 2 от Google, одновременно уверенно конкурируя с ведущими открытыми моделями. Large 3 — одна из первых открытых «передовых» моделей, в которой мультимодальность и многоязычие собраны под одной крышей, что ставит её в один ряд с Llama 3✶ от Meta✶ и Qwen3 Omni от Alibaba. Большинство компаний до сих пор комбинируют мощные LLM с отдельными мультимодальными модулями — так же, как делала и сама Mistral с Pixtral или Small 3.1.

Large 3 построена на архитектуре granular mixture of experts и использует 41 млрд активных параметров (из 675 млрд общих), что позволяет уверенно рассуждать в рамках контекста до 256 тысяч токенов. Эта структура сочетает скорость и интеллектуальную гибкость: модель может анализировать длинные документы, работать как агентный помощник и справляться со сложными корпоративными задачами. Mistral позиционирует Large 3 как универсальный инструмент для анализа документов, программирования, создания контента, работы ИИ‑ассистентов и автоматизации рабочих процессов.

Одновременно с этим компания представила новую линейку компактных моделей под названием Ministral 3. Серия включает девять плотных высокопроизводительных моделей трёх размеров — 14B, 8B и 3B параметров — и трёх вариантов: Base (базовая предобученная модель), Instruct (оптимизированная под диалог и ассистирование) и Reasoning (заточенная под сложную логику и аналитические задачи).

Компания утверждает, что Ministral 3 показывает результаты на уровне или выше лидеров среди открытых моделей, но при этом работает эффективнее и генерирует меньше токенов при выполнении тех же задач. Все версии поддерживают обработку изображений, работают с контекстом 128–256K токенов и понимают несколько языков.

✶ Meta — деятельность организации запрещена на территории РФ.
✶ Llama — проект компании Meta Platforms Inc., деятельность которой запрещена на территории РФ.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник

Mistral выпустила модель Large 3 675B и девять версий Ministral 3 (3B/8B/14B × Base/Instruct/Reasoning)

Другие новости

Информация