Viktori777 23 окт 2024 в 06:06

Сравнение Stable Diffusion 3.5 Large, Midjourney 6.1, Flux 1.1 Pro

Простой

4 мин

6.9K

Искусственный интеллект

Обзор

Комментарии 11

axion-1 23 окт 2024 в 10:09

В картинке с кафе у Stable Diffusion явно часть предыдущего промпта с "Whispers of the forest" попала. Возможно что-то скопипастилось неправильно.

Viktori777 23 окт 2024 в 12:05

Благодарю. Исправила.

AlexRihter9690 23 окт 2024 в 11:30

Тестил флюкс. Анатомия, пожалуй, лучшая из всех моделей, но вот всё остальное вообще никак. Как будто датасет был слишком однобоким и модель не может генерировать более специфические запросы

Overgod 23 окт 2024 в 12:22

SD3.5 можно запускать локально, а также можно дообучать. Что делае его сразу на голову выше остальных.

Я бы сказал что сейчас SDXL лучше всех именно из за огромного количества вариаций моделей, лор инструментов и т.д.

Будем надеется что SD3.5 через какое то время сместит SDXL с пъедистала.

(На счёт Flux-dev, там есть некоторые проблемы с дообучением и лицензией)

FiLunder7 23 окт 2024 в 21:14

На самом деле разница в качестве Флакса между дев и про довольно номинальна. И лоры тоже к нему уже есть и работают неплохо. Ну и я бы не сказал что sdxl на пьедестале. Для 2д я вообще все еще 1.5 использую, так как он выдает более качественный результат. Хотя и хуже следует промту.

Overgod 24 окт 2024 в 12:06

Да лоры работают. Я сам лично обучал пару лор для Flux и они работают очень даже неплохо. А вот на счет полноценного файтюнинга читал что у Flux-dev с этим очень серьезные проблемы плюс еще не очень хорошая лицензия мягко говоря не добавляет энтузиазма тем кто готов заняться файтюнингом.

На счет SD 1.5, ну я знаю что ими до сих пор пользуются. Но честно говоря мне они не кажется хоть в чем то лучше чем SDXL.

Я тоже обычно 2D рисую и для меня SDXL на основе Pony гораздо более качественным кажется чем SD1.5. Но конечно на SD1.5 осталось очень много моделей которые рисуют в очень классных стилях. Я даже как то раз несколько дней смешивал разные SDXL модели и лоры для того что бы получить похожий стиль на одну из моих любимых моделей SD1.5 и в итоге все получилось, но это было сложно.

dxq3 23 окт 2024 в 14:52

да разве так тестируют? Ни одним промтом на попу не посадили нейронки. Про генерацию рук я молчу, тут все ясно, но можно же придумать нечто интереснее поясного портрета или простенького пейзажа.

Я извращался в тестах такими запросами - антропоморфный реалистичный медведь в кимоно и с нунчаками делает прыжок с ударом задней лапы, нападая на антропоморфного тигра. После такого промта сразу становится понятно, что хайп о силе нейронок сильно раздут. Ожидаешь нечто вроде "Кунгфу Панда" в реалистичном сеттинге - по факту получаешь нелепую мешанину, как будто слепой человек нафотошопил.

FiLunder7 23 окт 2024 в 21:20

А зачем? Тут тест именно какие картинки можно использовать картинки в продакшене. Понятное дело что поломать можно все что угодно.

Astus 23 окт 2024 в 16:50

Иногда переключаюсь на Flux, но в целом пока всё также предпочитаю SDXL, соотношение результат/быстродействие/гибкость у него высочайшие, по моему мнению и опыту - лучшее из имеющихся.
Примеры по вышеописанным промптам, как есть, первая генерация, без инпайнта и прочего:

JPG 3mb 4000x1000

codecity 23 окт 2024 в 19:00

Интересно что в генерации изображений нет таких гигантов как OpenAI, которая вбухивает миллиарды. Midjourney более мелкая контора и успехи куда менее заметны.

Да и, видимо, область применимости у картинок не так уже велика. По сути такие картинки только как КПДВ для статьи или обложки/игры годятся. Особо на важные процессы, связанные с выживанием человечества - не влияет. Ну будет красивая картинка - хорошо, не будет - ну и без нее прочитаем суть.

Важнее как раз было бы генерить диаграммы наглядные и учебные пособия, а для этого нужна точность интеграции текста в картинку.

lenabrel 28 окт 2024 в 04:51

Я пользовалась разными генераторами картинок, только что попробывала сгенерировать эти промпты на aifusionart и он не плохо справился.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий