Комментарии 15
Интересно, со временем удастся её запустить на менее топовой карте(с 16 Гб видеопамяти), как первую версию FLUX?
Очень квантованную можно конечно: flux2-dev-Q2_K.gguf
Еще стоит упомянуть что Flux2 понимает запросы на 18 языках, русский в их числе и при этом нормально рисуется русский текст на картинке.
У меня на 4060Ti неквантованная flux2_dev_fp8mixed.safetensors идет со скоростью 32.59s/it, сжирая 63Гб ОЗУ из 128. При этом пока не работают никакие из старых оптимизаций типа First Block Cache, Тriton, sdpa и т.д. Лайтнинг лоры тоже пока нет. Т.е. в среднем на картинку 1024 на 1024 уходит около 10 минут. Хотя полностью видеопамять почему-то не используется.

Если же взять к примеру q4 gguf, то скорость и загрузка видеопамяти остаются точно такими же, а загрузка обычной памяти снижается до 40Гб.
Сравнение fp8 с q4_0 с одинаковым запросом и сидом https://imgsli.com/NDMxMDAw
Но в любом случае сейчас пока рано судить и нужно пару недель подождать пока Comfy обновится раз несколько и появится лайтнинг лора.
у меня на 3060 с 12Гб работает flux2-dev-Q3_K_M.gguf
8 минут на картинку без входных рефов. С ними все замедляется.
5070TI 16GB, 32GB RAM, 1TB PCI5 SSD со свап файлом в 200 гигов, работает fp8 модель с fp8 клипом, ренедерит за 150-500 секунд в зависимости от кол-ва рефернсных изображений, пока пробовал от 1 до 3 только. Это в 1024, 2048 делала 20 минут)) Никаких GGUF))
Да, уже гоняю её на RTX 4868 TI, квантвованная на 16 отлично работает. Есть квант модель на 8 она как я понял для более слабого железа
https://github.com/deepbeepmeep/Wan2GP?tab=readme-ov-file тут уже обещают 8б квант запускать на 9гб

Извините за офтоп, подскажите пожалуйста у вас с https://huggingface.co/ файлы нормально качаются?
Для российского интернета "не качается" - это нормально. Попробуйте зеркало: https://hf-mirror.com
У меня на ростелекоме 16 кб блок на https://huggingface.co/ с 21 октября.
требуется около 90 ГБ VRAM. Хорошая новость в том, что NVIDIA совместно с BFL уже выпустили оптимизированные FP8-квантизации, снижающие потребление памяти примерно на 40%. Это делает локальный запуск FLUX.2 [dev] реальностью на топовых картах RTX 4090 и 5090
с каких пор у этих видеокарт есть версии на 54 гб vram(-40% от 90 гб)?
Лучше уж новую z image turbo использовать, на 3060 12gb с 32 озу за 30 секунд генерит с 9 шагами 1024x1024

Вышла FLUX.2 — open source-конкурент Nano Banana