85GB May 22 2023 at 19:00

Большое сравнение нейросетей

Medium

11 min

28K

Graphic design * Artificial Intelligence

From sandbox

+47

Comments 49

Pinned comments

Hottych May 23 2023 at 13:21

Согласно роликам на ютубах, народ с MJ уже тоже так наловчился извращаться, что получает то, что хочет. Хотя, конечно, прикручивание дополнительного набора нейронок типа той же controlNet дает очень неплохой буст.

А вот по красоте картинки SD пока до коммерческих вариантов не дотягивает, увы. Это, конечно же, вкусовщина, но все же.

Mike_666 May 22 2023 at 19:50

В статье про Stable Diffusion стоило бы упомянуть Control Net, civitai.com, возможность создания своих textual inversion, LoRa и т.п на геймерских видеокартах или в колабе.

Открытый исходный код + живое сообщество творит такие чудеса, что у закрытых аналогов не остается ни шанса.

85GB May 22 2023 at 22:00

Control Net я описала простыми словами, например, догенерация, да и в целом в статье старалась не душнить.

А про сообщество и исходный код — спорный момент. Я дизайнер и мне важна работа здесь и сейчас, инстаграмчики для клиентов, рекламные баннеры здесь и сейчас, а не через полгода, когда я разберусь со всеми фишками, миллионом моделей и Лора, и тем более с коллабами. О чём и пишу в выводе, собственно.

bahopp May 23 2023 at 06:10

благодаря версиям с интерфейсом (например, от DAINAPP с патреона) порог вхождения в сейбл стремится к нулю, абсолютно коробочно - установил и генери, и с хорошей оптимизацией к старому недорогому железу

Reef86 May 31 2023 at 09:51

Насчет запрещенки, у SD ведь есть обученные модели, которые может создать любой человек, и добавить туда что угодно. Ну по крайней мере я вижу, что на civitai куча nsfw моделей, с очень откровенными примерами.

Hottych May 22 2023 at 20:03

Что-то похожее на догенерацию в миджорней есть, хоть и сделано через одно место.

85GB May 22 2023 at 21:53

только через сиды, а борьба с сидами — это отдельный вид извращений

Hottych May 23 2023 at 12:40

Ну я больше про аплоад заапскейленых предыдущих генераций. Но сиды тоже часть этого извращения, да.

iskateli May 22 2023 at 22:31

название поста "Большое сравнение нейросетей" заблуждает, думал сейчас будет про виды и архитектуры нейросетей, как например здесь и здесь, а тут про генераторы картинок

metradesign May 22 2023 at 23:58

Обзор отличный.

Я не вполне понимала, стоит ли мне вообще кидаться в стейбл, но сейчас думаю что наверное для моих целей не надо пока ?

ZillahGiovanni May 23 2023 at 03:24

"Галопом по европам" но пойдет, интересный обзор получился, хотя многое я и так знал, а вот для новичков вполне себе. 8)

PS Изнываю от любопытства, какие исходники использовали для Кандинский, тела и лица которые он генерит ни с одной сетью не перепутать, вот где самый что ни на есть кринж. 8))

smart_alex May 23 2023 at 05:53

Привет, меня зовут Юля, 85GB

Привет, я Alex, 50TB :)

Fedorkov May 23 2023 at 09:02

Чтобы разобраться в этом, нужно потратить ОГРОМНОЕ количество времени.

Ну или попросить кого-то более технически подкованного. Я где-то час потратил на установку (с доп. моделями) и ещё несколько часов поигрался с промптами из интернета. В итоге начало получаться, на мой взгляд, совсем неплохо.

AlexB17 May 23 2023 at 09:59

Очень поверхностно. Я понимаю что всей глубины и тонкостей работы с SD очень сложно осознать, но важно было донести что у всех остальных сеток возможностей больше того что вы описали почти нет, им выше уже не прыгнуть, а SD может по качеству уже сейчас выдавать приличные вещи, а если вникнуть в процесс то уже можно выдавать просто космическое качество. Например тот же апскейл через ControlNet Tiles может вам без артефактов сделать 4К+ картинку с высочайшей нативной детализацией, чего другие сетки пока не могут.

Hottych May 23 2023 at 12:47

С чего это вдруг SD такая могущественная, если технология "представления" плюс-минус та же? Интерфейсы могут гораздо больше, не спорю, и развиваются быстрее, именно за счет того, что она опен сорс. Но тот же апскейл можно другой нейронкой делать без проблем.

AlexB17 May 23 2023 at 13:11

Интерфейсы это хорошо, в Automatic1111 уже давно были фичи которых нет у конкурентов, но внедрение ControlNet и особенно версии 1.1 позволило очень мощно управлять генерацией и выполнять еще много функций.
Плюс огромное количество чекпоинтов, эмбеддингов, LoRA и возможность тренировать свои - это все дает повышение качества в итоге и позволяет получить именно то что хочется а не рандомный результат.
А апскейл всегда лучше сделать той же моделью которой и делалсь генерация, что бы не отличался стиль.

Hottych May 23 2023 at 13:21

AlexB17 May 23 2023 at 13:33

Меня больше фотореализм пока привлекает, с этим проблем нет, уже можно делать.
Вот например мой рендер с апскейлом через контрол нет, тут конечно есть что подправить в фш, это чистый рендер из SD подкрутил только в CameraRAW по цвету слегка.
https://cdn.discordapp.com/attachments/752489365967601664/1104359707969343594/01066-3758308780.jpg

85GB May 23 2023 at 14:20

Я даже не удивлена, что это именно женщина. И да, я писала, что у Стейбла огромная перспектива, но допустим, если я хочу получить женщину, которая пьёт кофе, то для этого мне сначала нужно обучить нейронку на пьющих кофе других женщинах, а чтоб наверняка, ещё и мужчинах, чтобы нейронка хотя бы понимала, как выглядит чашка кофе, стакан кофе (с ручкой и без) и т.д., иначе она будет жевать носом зёрна. Грубый пример, но надеюсь понятный. Если у вас есть время этим заниматься - почему бы и нет, а я простой смертный диз, я хочу быстрых решений))

AlexB17 May 24 2023 at 06:04

Просто этот рендер кидал в дискорд - что бы не встраивать огромный файл дал ссылку, а так и животных рендерю и ландшафты и много чего еще. Про пьющих кофе людей можно не обучать отдельно, SD прекрасно понимает контекст, если будет криво то инпеинтом поправить не составляет труда, а запущенные случаи инпеинт скетч.
Я понимаю что нужно время разобраться в инструменте, что бы получать отличные рендеры именно того что вам хотелось, но и поверхностные обзоры генеративных сеток в стиле "я закинул промт "рыжий кот" во все сетки и что из этого вышло" тоже уже начинают подбешивать, их на этом ресурсе уже очень много. У вас обзор вышел более подробным, но субъективные оценки немного портят впечатление, например у SD в запрещенке 3 балла - хотя там вообще нет цензуры, и такие же 3 балла у зацензуренной во все поля Mj.

85GB May 24 2023 at 08:21

Новая sd зацензурена, и я пишу об этом, поскольку создатели хотят избежать дипфейков и фейк ньюс, которые происходят с Миджи. Но да, это легко обойти, и да, моя оценка субъективна, как и оценка любого другого человека)

NickyX3 May 24 2023 at 11:08

Оно разве не зависит от моделей? F222 помнится прекрасно генерила обнаженку

AlexB17 May 24 2023 at 12:23

Новая 2.1 да, только ей почти никто не пользуется, а версия 1.5 на которой 99% всех кастомных моделей и LoRA основано не зацензурена совсем.

4manana May 23 2023 at 14:47

а можно примеры?

Newbilius May 23 2023 at 11:41

С одной стороны, какая-то цензура нужна

Развернёте мысль про этому самую сторону - какая цензура "нужна" внутри инструмента? Word, который банит нехорошие слова на этапе написания или аудио-редактор, которые запикивает то, что считает нужным выглядит как феерический бред. Почему же в системе генерирования картинок такое может восприниматься как "нужное"?

85GB May 23 2023 at 14:29

Есть глобальная проблема: фейк ньюс. Сложно ограничить интернет и форс новости о взрыве Пентагона, но легко ограничить инструменты создания фейковых "фоточек". Так что цензура — это сложная тема, и чем больше будет фейк ньюс, тем выше риск блокировки нейронок. Поэтому да, некая цензура нужна, но скорее не отдельные на слова (как сейчас), а на словосочетания.

Ogoun May 23 2023 at 20:19

Фейк-ньюс не решится цензурой в нейронках, и даже их полной отменой. Фейк-ньюс один из политических инструментов который появился задолго до современных технологий.

85GB May 24 2023 at 08:23

Верно, но хайп порождает больше спекуляций и паники, бюрократические машины медленные и им проще сразу всё взять и отменить, чем разбираться. Тем более с учётом бесконечного дележа рынка в политических и бизнесовых эшелонах

Hottych May 23 2023 at 13:23

Плюс один, к тому что стоит поменять название.

И хотелось бы сравнение сложности получения консистентных изображений.

85GB May 23 2023 at 13:35

допускаю, но как именно?

arman_ka May 24 2023 at 09:20

Кандинский — бесплатный. Вариант доступа один — через сайт.

это не правда, недавно даже была статья тут на хабре, есть бот в телеграмме, ещё https://rudalle.ru/ и всякие приложения сбера типа салют.

85GB May 24 2023 at 12:04

Рудалли — это древний огрызок, который забросили, а не тот Кандинский, про который речь в посте. Телеграм-боты я не рассматриваю вообще, потому что они есть у каждого захудалого канала, например, построенные на стейбле и утверждающие. что они Миджорни. С салютом вышел промах, проапдейчу

arman_ka May 25 2023 at 18:20

Вы, наверное, давно не заходили на сайт. На рудали сейчас как раз кандинский 2.1 размещён. Но да по возможностям хуже Fusion brain, но типа один из альтернатив.

Alexey_Bunak May 25 2023 at 18:56

https://t.me/kandinsky21_bot - официальный бот Кандински 2.1 от Сбера

arman_ka May 24 2023 at 09:23

Stable Diffusion — ад на земле

кажется ты очень поверхностно всё изучила, для стейбла есть браузерный графический интерфейс, где можно как и везде просто писать промт словами. Ну или не понятно почему ад. Вроде наоборот круто что ты можешь указать что не хочешь видеть на картинке.

85GB May 24 2023 at 12:06

я же указала, что есть сайты, но они платные или интерфейс не имеет такое количество кнопок, как у автоматика. автоматик - самая популярная версия, имеющая наибольший смысл в своём существовании и вес в сообществе

arman_ka May 25 2023 at 18:17

Я не про сайты, есть локальный сервер, бесплатный. В остальном возможно правы, я поверхностно смотрел.

85GB May 25 2023 at 18:50

локальный сервер - это как раз автоматик. про который я и писала в статье

arman_ka May 24 2023 at 09:29

Шедеврум. Здесь прям адуха. И да, это оригинальный размер.

Тут тоже не доизучала, там увеличенная версия генерится через минуту после выкладывания

85GB May 24 2023 at 12:14

На момент написания статьи — точно не через минуту и даже не через час. Качество при этом остаётся таким же дерьмовым, но проапдейчу этот момент, спасибо.

arman_ka May 25 2023 at 18:24

по вечерам прям быстро апскейлится, разве что мб кэш не обновляется надо открывать отдельный слой с картинкой.

Alexey_Bunak May 25 2023 at 19:11

Вот зря Вы так про Stable Diffusion, есть замечательный наш человек, ХрисТ, автор модели Deliberate и ее inpaint версии. Скачиваешь SD от Automatic1111, за сутки смотришь все бесплатные видео от ХрисТа, ставишь несколько полезных плагинов и вперед. Качество генерации в разы выше миджёрни, никакой цензуры, лайфхаки, советы и прочее. Через сутки ты делаешь уже шедевры, а хочешь стиль MJ, есть у него и такой, 1 клик и вуаля!

Сам с нуля дочери сваял альбом на выпускной + сувениры за 4 дня, разобравшись с полного нуля, и я ни разу не дизайнер и в фотошопе даже фон нормально убрать не могу. Не говоря о каких-то правках.
Вот сегодня выпустили, дети пищали от результатов обработки их фото. Там 2 тематики - Гарри Поттер (все в мантиях на фоне замка) и супергеройская тема, там кто кем только не стал...

85GB May 26 2023 at 08:52

Я максимально подробно изложила в статье, почему Стейбл — это плохо, но перспективно. И да, когда я погружалась в него, то смотрела видео христа, и нет, результат не лучше Миджорни (тем более с Делиберейт, есть действительно реалистичные модели), а чтобы был лучше Миджи 5.1 версии, надо потратить уйму времени на редактуру промптов, тем более отрицательных, потому что это вообще дичь. В моём понимании негативный промпт должен выглядеть как "без бороды" или "без шляпы", а не "без семи ног, без кривых глаз".

Alexey_Bunak May 28 2023 at 08:32

Давайте на чистоту. MJ это просто дообучаемый SD, по сути.

Для наглядного примера - MJ - это Яндекс.Такси - ткнул 2 точки, увидел цену, заказал. ВСЕ.
SD - Это Яндекс.Драйв - каршеринг, тут уже чуть сложнее, рулить придется самому, но ты можешь изменять маршрут по своему желанию, делать остановки, ехать куда хочешь. Да, уже нужны права, да, сложнее, но это несравнимо.

Также и с нейронками, MJ постоянно учат, и постоянно цензурируют, никакого шаг влево, шаг вправо. SD1.5 может творить что угодно, любую запрещенку, любые темы. Но самый главный его плюс, ОН ДООБУЧАЕМ. Не понимает он что такое "советский солдат", напихал ему примеров, обозвал "soviet solder" и он начал понимать что ты от него хочешь.

Но главный минус для меня, в MJ, я не могу там сделать из своей дочки фею или супер женщину. Не могу друга переодеть в форму из СтарТрека.

МЖ - учит его владелец, СД - учит весь мир. Это как противостояние, iOS или Android. Я потратил 2 дня потому что я ни черта не понимаю в дизайне и рисовании и я плохо знаю английский ;) а вот знание английского, всех нюансов тела, поз, одежды и прочего - сильно упрощает жизнь.

85GB May 28 2023 at 12:58

А я разве спорила с этим? Буквально несколько раз в статье я говорю о том, что мне нужны быстрые и простые решения, то есть Миджи. И привожу примеры использования Стейбла как раз при создании таких "фотосессий", где можно одеть человека во что угодно или поменять позы. Я действительно не понимаю, о чём спор, если каждый выбирает для себя, о чём я и пишу в статье.

85GB May 26 2023 at 08:56

Вот даже вы пишете, что за сутки(!!!) можно посмотреть видосы, чтобы понять работу Стейбла, когда на инструкцию к Миджорни надо потратить минут 10, а чтобы её нормально освоить - потратить пару часов всего лишь

Alexey_Bunak May 28 2023 at 08:05

у каждого свое понятие "нормально освоить", я вот совсем не уверен что и за пару дней MJ можно нормально освоить. Если не тыкать кнопочки дополнительные, то стартовать с SD можно тоже через 5 минут.

Alexey_Bunak May 28 2023 at 08:35

Напишите, пожалуйста, когда MJ научится делать так в 2 клика

Maxim_Q Apr 8 2024 at 00:52

Поясните в чем была сделана замена одежды и какие промты использовались при этом?

Galperin_Mark Apr 2 at 09:41

Шедеврум уже стал доступен в браузере.