Видеомодель Kandinsky 5.0 Pro заняла 14-е место в рейтинге LMArena Text-to-Video Arena — это лучший результат среди всех моделей с открытой лицензией. Код и веса доступны на GitHub под лицензией MIT, то есть модель можно свободно использовать в коммерческих проектах.

Выше в рейтинге расположились только проприетарные решения: Veo3 от Google на первом месте, а также Kling от Kuaishou, Hailuo от MiniMax, Seedance от ByteDance и другие закрытые модели китайских и западных техгигантов. Ближайший открытый конкурент — Wan 2.2 A14B с лицензией Apache 2.0 — занимает лишь 20-е место.
Kandinsky 5.0 Pro — модель на 19 миллиардов параметров, генерирует HD-видео в разрешении 1280×768 при 24 кадрах в секунду. Максимальная длительность ролика — 10 секунд. Модель понимает промпты на русском и английском языках, поддерживает управление движением камеры и может создавать видео как по текстовому описанию, так и по исходному изображению.
Помимо Pro-версии, в семействе Kandinsky 5.0 есть облегчtнная Video Lite на 2 миллиарда параметров — она тоже попала в рейтинг LMArena на 22-е место и также распространяется под MIT. Технический отчtт о моделях был опубликован на arXiv 19 ноября 2025 года, а в рейтинг LMArena их добавили 12 декабря.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
