Обновить

Комментарии 15

Интересно, со временем удастся её запустить на менее топовой карте(с 16 Гб видеопамяти), как первую версию FLUX?

Очень квантованную можно конечно: flux2-dev-Q2_K.gguf

Еще стоит упомянуть что Flux2 понимает запросы на 18 языках, русский в их числе и при этом нормально рисуется русский текст на картинке.

У меня на 4060Ti неквантованная flux2_dev_fp8mixed.safetensors идет со скоростью 32.59s/it, сжирая 63Гб ОЗУ из 128. При этом пока не работают никакие из старых оптимизаций типа First Block Cache, Тriton, sdpa и т.д. Лайтнинг лоры тоже пока нет. Т.е. в среднем на картинку 1024 на 1024 уходит около 10 минут. Хотя полностью видеопамять почему-то не используется.

Если же взять к примеру q4 gguf, то скорость и загрузка видеопамяти остаются точно такими же, а загрузка обычной памяти снижается до 40Гб.

Сравнение fp8 с q4_0 с одинаковым запросом и сидом https://imgsli.com/NDMxMDAw

Но в любом случае сейчас пока рано судить и нужно пару недель подождать пока Comfy обновится раз несколько и появится лайтнинг лора.

у меня на 3060 с 12Гб работает flux2-dev-Q3_K_M.gguf
8 минут на картинку без входных рефов. С ними все замедляется.

5070TI 16GB, 32GB RAM, 1TB PCI5 SSD со свап файлом в 200 гигов, работает fp8 модель с fp8 клипом, ренедерит за 150-500 секунд в зависимости от кол-ва рефернсных изображений, пока пробовал от 1 до 3 только. Это в 1024, 2048 делала 20 минут)) Никаких GGUF))

Да, уже гоняю её на RTX 4868 TI, квантвованная на 16 отлично работает. Есть квант модель на 8 она как я понял для более слабого железа

Промпт "Фотография пин-ап. Латиноамериканка в бриджах и болеро марьячи показана в разных ракурсах. На спине сомбреро удерживается шнурком на шее." первая картинка nano-banana-pro, вторая flux-2-pro
Промпт "Фотография пин-ап. Латиноамериканка в бриджах и болеро марьячи показана в разных ракурсах. На спине сомбреро удерживается шнурком на шее." первая картинка nano-banana-pro, вторая flux-2-pro

Если вторая картинка от Flux это пин-ап, тогда я космонавт.

Извините за офтоп, подскажите пожалуйста у вас с https://huggingface.co/ файлы нормально качаются?

Для российского интернета "не качается" - это нормально. Попробуйте зеркало: https://hf-mirror.com

У меня на ростелекоме 16 кб блок на https://huggingface.co/ с 21 октября.

мтс тоже самое

требуется около 90 ГБ VRAM. Хорошая новость в том, что NVIDIA совместно с BFL уже выпустили оптимизированные FP8-квантизации, снижающие потребление памяти примерно на 40%. Это делает локальный запуск FLUX.2 [dev] реальностью на топовых картах RTX 4090 и 5090

с каких пор у этих видеокарт есть версии на 54 гб vram(-40% от 90 гб)?

Лучше уж новую z image turbo использовать, на 3060 12gb с 32 озу за 30 секунд генерит с 9 шагами 1024x1024

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости