timonin22 фев 2024 в 14:25

Официально Анонсирована Stable Diffusion 3

2 мин

12K

Искусственный интеллектДизайнБудущее здесь

Комментарии 28

JerryI 22 фев 2024 в 16:27

Потрясающе. Может я отстал, но вот текст всегда был проблемой ранее. Сейчас как будто все очень круто

MountainGoat 22 фев 2024 в 17:33

Да оно сейчас не так уж плохо.

Hidden text

JerryI 22 фев 2024 в 21:45

megamrmax 22 фев 2024 в 16:33

@timonin А есть ли готовые к употреблению (за денежки конечно) сервисы которые могли бы брать фотографию предмета на белом (однородном) фоне...ну например кепки и правильно "вставлять" в фотореалистичное сгенерированное изображение? Ну например берем фото кепки и пишем промт типа: "фотография молодого человека 17-23 лет в кепке, одетого в спортивный костюм без логотипов, стоящего на фоне кирпичной стены и держащего в руках подсолнух"

timonin 22 фев 2024 в 17:33

Есть, но все это работает сложнее, вы говорите про обучение и крайний стартап который пообещал это сделать получил 40 млн инвестиций. Вырезать фон и вставить, увы не достаточно.

MountainGoat 22 фев 2024 в 17:36

Платно не знаю, а бесплатно можно вставить небольшой кусочек на белый фон и сказать сетке додумать всё остальное. Я так из удачно получившегося лица ростовой портрет делал.

Но конечно, чтобы из мятой шапки вид спереди получить надетую и лихо закрученную набок, тут придётся уже много трансформировать вручную.

megamrmax 22 фев 2024 в 17:41

а не могли бы подсказать что за сервис использовался? Спасибо
PS из-за идиотских правил Хабра не могу часто отвечать... можно в личку ссылку плиз

MountainGoat 22 фев 2024 в 17:46

InvokeAI, модель JuggernautXL. Инструкции есть на их ютубе. Из неочевидного скажу, что этот тип операций называется inpainting, но при этом модель, созданную для inpainting, использовать не надо - они обучены делать минимально возможное изменение и противостоять перерисовыванию всего целиком.

ShadF0x 23 фев 2024 в 01:23

Из неочевидного скажу, что этот тип операций называется inpainting

Наоборот же, получается outpainting.

MountainGoat 23 фев 2024 в 08:51

Нет. Outpainting это увеличение геометрических размеров изображения, отрисовка за край имеющегося. А я обсуждаю, как сделать пустое изображение и рисовать внутри его границ. Это разные реализации алгоритма.

Cybermorzh 22 фев 2024 в 17:29

Разработчики Stable Diffusion 3 уверяют, что приложили максимум усилий для предотвращения использования модели во вред. Это включает в себя меры безопасности на этапах обучения, тестирования и развертывания модели.

Интересно узнать поподробнее. Модель будет отказываться создавать изображения вирусов, как DALL-E 2, и продвигать расовое разнообразие, как Gemini?

timonin 22 фев 2024 в 17:34

Скорее всего её просто не обучали ни на чем плохом. И в случае с NSFW это просто будут замыленные барби и кены.

Aelliari 22 фев 2024 в 17:41

Но ничто не помешает её дообучить (обучить новую) при наличии вычислительных мощностей, если все останется так как есть на данный момент

timonin 22 фев 2024 в 17:46

Это если модель будет выпущена в открытый доступ.

Aelliari 22 фев 2024 в 17:53

Есть предпосылки того, что в этот раз stability ai не опубликует? Но да, если такое произойдет - будет неприятно

DonkeyHot 24 фев 2024 в 05:51

там скорее-всего встроенные фильтры которые цензурируют внутри модели, они это уже делали во второй версии

7313 22 фев 2024 в 19:05

It will launch with full ecosystem of tools
It's a new base taking advantage of latest hardware & comes in all sizes
Enables video, 3D & more.
Need moar GPUs..
Боюсь что в этот раз довольно долго не появится никаких автоматиков1111, а родной интерфейс будет как обычно очень убогим. Ну и как бы не заявили 4090 в минимальных требованиях и уж точно вся веселуха будет не для счастливых обладателей обычных видеокарт с 8-12 памяти.

Axelaredz 23 фев 2024 в 10:23

Потому то сами разрабы сидят на ComfyUI :) а не Automatic1111

CodARM 22 фев 2024 в 20:30

Провел я небольшое исследование, и получается что максимальную версию с 8 миллиардами параметров затачивали под 24 гигабайт памяти. То есть нужна либо 4090, либо ждем новое поколение.

В кратце по расчетам, на моей видеокарте sdxl выедает 8 гигов ОЗУ при генерации в разрешении 768х768(3070 8gb, разгрузить максимум видеопамяти та еще морока). Сама sdxl на 3.5 миллиардов параметров. Скорее всего дефолтное разрешение увеличится до 1024х1024 пикселей из чего мы получаем условные 20-24 гигабайта на генерацию.

porn 22 фев 2024 в 20:45

разгрузить максимум видеопамяти та еще морока

Запускайте headless.

7313 22 фев 2024 в 21:34

Forge и фокус SDXL на 8 гигах в 16:9 вплоть до 2200 точек по широкой стороне генерят. Так что с учетом оптимизаций поменьше наверное памяти будет требовать

MountainGoat 22 фев 2024 в 22:41

Скорее всего дефолтное разрешение увеличится до 1024х1024 пикселей из чего мы получаем условные 20-24 гигабайта на генерацию.

Уже сейчас такое разрешение у SDXL и ей достаточно 12 гб.

All_x_under 23 фев 2024 в 20:36

На 8Гб 1070ti генерю 1024*1024 на фокусе и комфи sdxl

Mike_666 23 фев 2024 в 10:30

Только б код и вес не зажали...

А уже как починить эту самую *безопасность* сообщество разберется.

Resursator 24 фев 2024 в 10:32

Этот же самый лист ожидания грозится призвать на их сервак дискорда. Кажется, это будет ещё один пример, как открытый продукт ушёл прятаться за пейвол)

Mike_666 24 фев 2024 в 10:50

Это будет весьма печально...

Gluber 25 фев 2024 в 11:54

Я сейчас на компе использую Fooocus для генерации изображений. И на сколько я знаю, он же основан на стейбле. Интересно, войдут эти новые изменения в фокус?

timonin 25 фев 2024 в 11:54

Fooocus это WebUI для SDXL. Не войдут.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий