Pull to refresh

Comments 48

PinnedPinned comments

Согласно роликам на ютубах, народ с MJ уже тоже так наловчился извращаться, что получает то, что хочет. Хотя, конечно, прикручивание дополнительного набора нейронок типа той же controlNet дает очень неплохой буст.

А вот по красоте картинки SD пока до коммерческих вариантов не дотягивает, увы. Это, конечно же, вкусовщина, но все же.

В статье про Stable Diffusion стоило бы упомянуть Control Net, civitai.com, возможность создания своих textual inversion, LoRa и т.п на геймерских видеокартах или в колабе.

Открытый исходный код + живое сообщество творит такие чудеса, что у закрытых аналогов не остается ни шанса.

Control Net я описала простыми словами, например, догенерация, да и в целом в статье старалась не душнить.

А про сообщество и исходный код — спорный момент. Я дизайнер и мне важна работа здесь и сейчас, инстаграмчики для клиентов, рекламные баннеры здесь и сейчас, а не через полгода, когда я разберусь со всеми фишками, миллионом моделей и Лора, и тем более с коллабами. О чём и пишу в выводе, собственно.

благодаря версиям с интерфейсом (например, от DAINAPP с патреона) порог вхождения в сейбл стремится к нулю, абсолютно коробочно - установил и генери, и с хорошей оптимизацией к старому недорогому железу

Насчет запрещенки, у SD ведь есть обученные модели, которые может создать любой человек, и добавить туда что угодно. Ну по крайней мере я вижу, что на civitai куча nsfw моделей, с очень откровенными примерами.

Что-то похожее на догенерацию в миджорней есть, хоть и сделано через одно место.

только через сиды, а борьба с сидами — это отдельный вид извращений

Ну я больше про аплоад заапскейленых предыдущих генераций. Но сиды тоже часть этого извращения, да.

название поста "Большое сравнение нейросетей" заблуждает, думал сейчас будет про виды и архитектуры нейросетей, как например здесь и здесь, а тут про генераторы картинок

Обзор отличный.

Я не вполне понимала, стоит ли мне вообще кидаться в стейбл, но сейчас думаю что наверное для моих целей не надо пока ?

"Галопом по европам" но пойдет, интересный обзор получился, хотя многое я и так знал, а вот для новичков вполне себе. 8)

PS Изнываю от любопытства, какие исходники использовали для Кандинский, тела и лица которые он генерит ни с одной сетью не перепутать, вот где самый что ни на есть кринж. 8))

Привет, меня зовут Юля, 85GB

Привет, я Alex, 50TB :)

Чтобы разобраться в этом, нужно потратить ОГРОМНОЕ количество времени.

Ну или попросить кого-то более технически подкованного. Я где-то час потратил на установку (с доп. моделями) и ещё несколько часов поигрался с промптами из интернета. В итоге начало получаться, на мой взгляд, совсем неплохо.

Очень поверхностно. Я понимаю что всей глубины и тонкостей работы с SD очень сложно осознать, но важно было донести что у всех остальных сеток возможностей больше того что вы описали почти нет, им выше уже не прыгнуть, а SD может по качеству уже сейчас выдавать приличные вещи, а если вникнуть в процесс то уже можно выдавать просто космическое качество. Например тот же апскейл через ControlNet Tiles может вам без артефактов сделать 4К+ картинку с высочайшей нативной детализацией, чего другие сетки пока не могут.

С чего это вдруг SD такая могущественная, если технология "представления" плюс-минус та же? Интерфейсы могут гораздо больше, не спорю, и развиваются быстрее, именно за счет того, что она опен сорс. Но тот же апскейл можно другой нейронкой делать без проблем.

Интерфейсы это хорошо, в Automatic1111 уже давно были фичи которых нет у конкурентов, но внедрение ControlNet и особенно версии 1.1 позволило очень мощно управлять генерацией и выполнять еще много функций.
Плюс огромное количество чекпоинтов, эмбеддингов, LoRA и возможность тренировать свои - это все дает повышение качества в итоге и позволяет получить именно то что хочется а не рандомный результат.
А апскейл всегда лучше сделать той же моделью которой и делалсь генерация, что бы не отличался стиль.

Согласно роликам на ютубах, народ с MJ уже тоже так наловчился извращаться, что получает то, что хочет. Хотя, конечно, прикручивание дополнительного набора нейронок типа той же controlNet дает очень неплохой буст.

А вот по красоте картинки SD пока до коммерческих вариантов не дотягивает, увы. Это, конечно же, вкусовщина, но все же.

Меня больше фотореализм пока привлекает, с этим проблем нет, уже можно делать.
Вот например мой рендер с апскейлом через контрол нет, тут конечно есть что подправить в фш, это чистый рендер из SD подкрутил только в CameraRAW по цвету слегка.
https://cdn.discordapp.com/attachments/752489365967601664/1104359707969343594/01066-3758308780.jpg

Я даже не удивлена, что это именно женщина. И да, я писала, что у Стейбла огромная перспектива, но допустим, если я хочу получить женщину, которая пьёт кофе, то для этого мне сначала нужно обучить нейронку на пьющих кофе других женщинах, а чтоб наверняка, ещё и мужчинах, чтобы нейронка хотя бы понимала, как выглядит чашка кофе, стакан кофе (с ручкой и без) и т.д., иначе она будет жевать носом зёрна. Грубый пример, но надеюсь понятный. Если у вас есть время этим заниматься - почему бы и нет, а я простой смертный диз, я хочу быстрых решений))

Просто этот рендер кидал в дискорд - что бы не встраивать огромный файл дал ссылку, а так и животных рендерю и ландшафты и много чего еще. Про пьющих кофе людей можно не обучать отдельно, SD прекрасно понимает контекст, если будет криво то инпеинтом поправить не составляет труда, а запущенные случаи инпеинт скетч.
Я понимаю что нужно время разобраться в инструменте, что бы получать отличные рендеры именно того что вам хотелось, но и поверхностные обзоры генеративных сеток в стиле "я закинул промт "рыжий кот" во все сетки и что из этого вышло" тоже уже начинают подбешивать, их на этом ресурсе уже очень много. У вас обзор вышел более подробным, но субъективные оценки немного портят впечатление, например у SD в запрещенке 3 балла - хотя там вообще нет цензуры, и такие же 3 балла у зацензуренной во все поля Mj.

Новая sd зацензурена, и я пишу об этом, поскольку создатели хотят избежать дипфейков и фейк ньюс, которые происходят с Миджи. Но да, это легко обойти, и да, моя оценка субъективна, как и оценка любого другого человека)

Оно разве не зависит от моделей? F222 помнится прекрасно генерила обнаженку

Новая 2.1 да, только ей почти никто не пользуется, а версия 1.5 на которой 99% всех кастомных моделей и LoRA основано не зацензурена совсем.

С одной стороны, какая-то цензура нужна

Развернёте мысль про этому самую сторону - какая цензура "нужна" внутри инструмента? Word, который банит нехорошие слова на этапе написания или аудио-редактор, которые запикивает то, что считает нужным выглядит как феерический бред. Почему же в системе генерирования картинок такое может восприниматься как "нужное"?

Есть глобальная проблема: фейк ньюс. Сложно ограничить интернет и форс новости о взрыве Пентагона, но легко ограничить инструменты создания фейковых "фоточек". Так что цензура — это сложная тема, и чем больше будет фейк ньюс, тем выше риск блокировки нейронок. Поэтому да, некая цензура нужна, но скорее не отдельные на слова (как сейчас), а на словосочетания.

Фейк-ньюс не решится цензурой в нейронках, и даже их полной отменой. Фейк-ньюс один из политических инструментов который появился задолго до современных технологий.

Верно, но хайп порождает больше спекуляций и паники, бюрократические машины медленные и им проще сразу всё взять и отменить, чем разбираться. Тем более с учётом бесконечного дележа рынка в политических и бизнесовых эшелонах

Плюс один, к тому что стоит поменять название.

И хотелось бы сравнение сложности получения консистентных изображений.

допускаю, но как именно?

  1. Кандинский — бесплатный. Вариант доступа один — через сайт.

это не правда, недавно даже была статья тут на хабре, есть бот в телеграмме, ещё https://rudalle.ru/ и всякие приложения сбера типа салют.

Рудалли — это древний огрызок, который забросили, а не тот Кандинский, про который речь в посте. Телеграм-боты я не рассматриваю вообще, потому что они есть у каждого захудалого канала, например, построенные на стейбле и утверждающие. что они Миджорни. С салютом вышел промах, проапдейчу

Вы, наверное, давно не заходили на сайт. На рудали сейчас как раз кандинский 2.1 размещён. Но да по возможностям хуже Fusion brain, но типа один из альтернатив.

Stable Diffusion — ад на земле

кажется ты очень поверхностно всё изучила, для стейбла есть браузерный графический интерфейс, где можно как и везде просто писать промт словами. Ну или не понятно почему ад. Вроде наоборот круто что ты можешь указать что не хочешь видеть на картинке.

я же указала, что есть сайты, но они платные или интерфейс не имеет такое количество кнопок, как у автоматика. автоматик - самая популярная версия, имеющая наибольший смысл в своём существовании и вес в сообществе

Я не про сайты, есть локальный сервер, бесплатный. В остальном возможно правы, я поверхностно смотрел.

локальный сервер - это как раз автоматик. про который я и писала в статье

  1. Шедеврум. Здесь прям адуха. И да, это оригинальный размер.

Тут тоже не доизучала, там увеличенная версия генерится через минуту после выкладывания

На момент написания статьи — точно не через минуту и даже не через час. Качество при этом остаётся таким же дерьмовым, но проапдейчу этот момент, спасибо.

по вечерам прям быстро апскейлится, разве что мб кэш не обновляется надо открывать отдельный слой с картинкой.

Вот зря Вы так про Stable Diffusion, есть замечательный наш человек, ХрисТ, автор модели Deliberate и ее inpaint версии. Скачиваешь SD от Automatic1111, за сутки смотришь все бесплатные видео от ХрисТа, ставишь несколько полезных плагинов и вперед. Качество генерации в разы выше миджёрни, никакой цензуры, лайфхаки, советы и прочее. Через сутки ты делаешь уже шедевры, а хочешь стиль MJ, есть у него и такой, 1 клик и вуаля!

Сам с нуля дочери сваял альбом на выпускной + сувениры за 4 дня, разобравшись с полного нуля, и я ни разу не дизайнер и в фотошопе даже фон нормально убрать не могу. Не говоря о каких-то правках.
Вот сегодня выпустили, дети пищали от результатов обработки их фото. Там 2 тематики - Гарри Поттер (все в мантиях на фоне замка) и супергеройская тема, там кто кем только не стал...

Я максимально подробно изложила в статье, почему Стейбл — это плохо, но перспективно. И да, когда я погружалась в него, то смотрела видео христа, и нет, результат не лучше Миджорни (тем более с Делиберейт, есть действительно реалистичные модели), а чтобы был лучше Миджи 5.1 версии, надо потратить уйму времени на редактуру промптов, тем более отрицательных, потому что это вообще дичь. В моём понимании негативный промпт должен выглядеть как "без бороды" или "без шляпы", а не "без семи ног, без кривых глаз".

Давайте на чистоту. MJ это просто дообучаемый SD, по сути.

Для наглядного примера - MJ - это Яндекс.Такси - ткнул 2 точки, увидел цену, заказал. ВСЕ.
SD - Это Яндекс.Драйв - каршеринг, тут уже чуть сложнее, рулить придется самому, но ты можешь изменять маршрут по своему желанию, делать остановки, ехать куда хочешь. Да, уже нужны права, да, сложнее, но это несравнимо.

Также и с нейронками, MJ постоянно учат, и постоянно цензурируют, никакого шаг влево, шаг вправо. SD1.5 может творить что угодно, любую запрещенку, любые темы. Но самый главный его плюс, ОН ДООБУЧАЕМ. Не понимает он что такое "советский солдат", напихал ему примеров, обозвал "soviet solder" и он начал понимать что ты от него хочешь.

Но главный минус для меня, в MJ, я не могу там сделать из своей дочки фею или супер женщину. Не могу друга переодеть в форму из СтарТрека.

МЖ - учит его владелец, СД - учит весь мир. Это как противостояние, iOS или Android. Я потратил 2 дня потому что я ни черта не понимаю в дизайне и рисовании и я плохо знаю английский ;) а вот знание английского, всех нюансов тела, поз, одежды и прочего - сильно упрощает жизнь.

А я разве спорила с этим? Буквально несколько раз в статье я говорю о том, что мне нужны быстрые и простые решения, то есть Миджи. И привожу примеры использования Стейбла как раз при создании таких "фотосессий", где можно одеть человека во что угодно или поменять позы. Я действительно не понимаю, о чём спор, если каждый выбирает для себя, о чём я и пишу в статье.

Вот даже вы пишете, что за сутки(!!!) можно посмотреть видосы, чтобы понять работу Стейбла, когда на инструкцию к Миджорни надо потратить минут 10, а чтобы её нормально освоить - потратить пару часов всего лишь

у каждого свое понятие "нормально освоить", я вот совсем не уверен что и за пару дней MJ можно нормально освоить. Если не тыкать кнопочки дополнительные, то стартовать с SD можно тоже через 5 минут.

Напишите, пожалуйста, когда MJ научится делать так в 2 клика

Поясните в чем была сделана замена одежды и какие промты использовались при этом?

Sign up to leave a comment.

Articles