Китайская компания MiniMax выпустила модель M2.7, главной особенностью которой стало участие самой модели в процессе собственной эволюции. По заявлению разработчиков, M2.7 - первая модель серии, которая активно помогала строить инфраструктуру для своего обучения: создавала навыки для RL-пайплайнов, обновляла собственную память, оптимизировала процесс обучения с подкреплением и итерировала над архитектурой рабочего окружения.

Бенчмарки из описания релиза
Бенчмарки из описания релиза

В области программирования M2.7 разработчики заявляют результаты уровня топовых моделей. На бенчмарке SWE-Pro модель набрала 56.22%, вплотную приблизившись к Claude Opus 4.6.

Отдельно обращают внимание на улучшения по бенчмаркам, оценивающим верхнеуровневое понимание кода и общей логики на уровне проекта в целом: Terminal Bench 2 (57.0%), NL2Repo (39.8%)

Также релиз описывает улучшение в других областях:

  • Офисные и профессиональные задачи

  • Машинное обучение

  • Агентский фнукционал

В этом же релизе объявлено (вероятно, впервые?) о выпуске фреймворка OpenRoom - интерактивного визуального пространства для взаимодействия с AI-агентами и инструментами.

Предыдущая версия модели (M2.5) на сегодня является самой популярной на OpenRouter. Цена новой модели осталась практически такой же.

https://openrouter.ai/models?order=most-popular