Comments 2
Это первый случай, когда настолько быстрая видеогенерация стала доступна в открытом формате.
Self forcing LoRA доступны для Wan 2.1 и Wan 2.2 уже давно. Для генерации в четыре шага в Krea Realtime используется открытая lightx2v которую они не обучали, а взяли готовой.
Фишка здесь не в Self forcing а в преобразовании диффузионной модели в авторегресионную, строящую следующие кадры на основании предидущих.
Значимость новой модели не столько в быстрой видеогенерации - wan 2.2 может и в три шага генерировать (1 high + 2 low) с вполне приличным результатом, а в том что она генерирует не все кадры видео сразу, а в виде потока кадров, что:
1) снимает ограничение на длинну ролика
2) позволяет получать результат покадрово, не дожидаясь полной генерации ролика
3) позволяет менять промт на лету, по мере генерации
Krea AI открыла исходный код своей системы генерации видео