Комментарии 11
В картинке с кафе у Stable Diffusion явно часть предыдущего промпта с "Whispers of the forest" попала. Возможно что-то скопипастилось неправильно.
Тестил флюкс. Анатомия, пожалуй, лучшая из всех моделей, но вот всё остальное вообще никак. Как будто датасет был слишком однобоким и модель не может генерировать более специфические запросы
SD3.5 можно запускать локально, а также можно дообучать. Что делае его сразу на голову выше остальных.
Я бы сказал что сейчас SDXL лучше всех именно из за огромного количества вариаций моделей, лор инструментов и т.д.
Будем надеется что SD3.5 через какое то время сместит SDXL с пъедистала.
(На счёт Flux-dev, там есть некоторые проблемы с дообучением и лицензией)
На самом деле разница в качестве Флакса между дев и про довольно номинальна. И лоры тоже к нему уже есть и работают неплохо. Ну и я бы не сказал что sdxl на пьедестале. Для 2д я вообще все еще 1.5 использую, так как он выдает более качественный результат. Хотя и хуже следует промту.
Да лоры работают. Я сам лично обучал пару лор для Flux и они работают очень даже неплохо. А вот на счет полноценного файтюнинга читал что у Flux-dev с этим очень серьезные проблемы плюс еще не очень хорошая лицензия мягко говоря не добавляет энтузиазма тем кто готов заняться файтюнингом.
На счет SD 1.5, ну я знаю что ими до сих пор пользуются. Но честно говоря мне они не кажется хоть в чем то лучше чем SDXL.
Я тоже обычно 2D рисую и для меня SDXL на основе Pony гораздо более качественным кажется чем SD1.5. Но конечно на SD1.5 осталось очень много моделей которые рисуют в очень классных стилях. Я даже как то раз несколько дней смешивал разные SDXL модели и лоры для того что бы получить похожий стиль на одну из моих любимых моделей SD1.5 и в итоге все получилось, но это было сложно.
да разве так тестируют? Ни одним промтом на попу не посадили нейронки. Про генерацию рук я молчу, тут все ясно, но можно же придумать нечто интереснее поясного портрета или простенького пейзажа.
Я извращался в тестах такими запросами - антропоморфный реалистичный медведь в кимоно и с нунчаками делает прыжок с ударом задней лапы, нападая на антропоморфного тигра. После такого промта сразу становится понятно, что хайп о силе нейронок сильно раздут. Ожидаешь нечто вроде "Кунгфу Панда" в реалистичном сеттинге - по факту получаешь нелепую мешанину, как будто слепой человек нафотошопил.
Иногда переключаюсь на Flux, но в целом пока всё также предпочитаю SDXL, соотношение результат/быстродействие/гибкость у него высочайшие, по моему мнению и опыту - лучшее из имеющихся.
Примеры по вышеописанным промптам, как есть, первая генерация, без инпайнта и прочего:
JPG 3mb 4000x1000

Интересно что в генерации изображений нет таких гигантов как OpenAI, которая вбухивает миллиарды. Midjourney более мелкая контора и успехи куда менее заметны.
Да и, видимо, область применимости у картинок не так уже велика. По сути такие картинки только как КПДВ для статьи или обложки/игры годятся. Особо на важные процессы, связанные с выживанием человечества - не влияет. Ну будет красивая картинка - хорошо, не будет - ну и без нее прочитаем суть.
Важнее как раз было бы генерить диаграммы наглядные и учебные пособия, а для этого нужна точность интеграции текста в картинку.
Я пользовалась разными генераторами картинок, только что попробывала сгенерировать эти промпты на aifusionart и он не плохо справился.
Сравнение Stable Diffusion 3.5 Large, Midjourney 6.1, Flux 1.1 Pro