timonin Feb 22 2024 at 14:25

Официально Анонсирована Stable Diffusion 3

2 min

11K

Artificial IntelligenceDesignThe future is here

Comments 28

JerryI Feb 22 2024 at 16:27

Потрясающе. Может я отстал, но вот текст всегда был проблемой ранее. Сейчас как будто все очень круто

MountainGoat Feb 22 2024 at 17:33

Да оно сейчас не так уж плохо.

Hidden text

JerryI Feb 22 2024 at 21:45

megamrmax Feb 22 2024 at 16:33

@timonin А есть ли готовые к употреблению (за денежки конечно) сервисы которые могли бы брать фотографию предмета на белом (однородном) фоне...ну например кепки и правильно "вставлять" в фотореалистичное сгенерированное изображение? Ну например берем фото кепки и пишем промт типа: "фотография молодого человека 17-23 лет в кепке, одетого в спортивный костюм без логотипов, стоящего на фоне кирпичной стены и держащего в руках подсолнух"

timonin Feb 22 2024 at 17:33

Есть, но все это работает сложнее, вы говорите про обучение и крайний стартап который пообещал это сделать получил 40 млн инвестиций. Вырезать фон и вставить, увы не достаточно.

MountainGoat Feb 22 2024 at 17:36

Платно не знаю, а бесплатно можно вставить небольшой кусочек на белый фон и сказать сетке додумать всё остальное. Я так из удачно получившегося лица ростовой портрет делал.

Но конечно, чтобы из мятой шапки вид спереди получить надетую и лихо закрученную набок, тут придётся уже много трансформировать вручную.

megamrmax Feb 22 2024 at 17:41

а не могли бы подсказать что за сервис использовался? Спасибо
PS из-за идиотских правил Хабра не могу часто отвечать... можно в личку ссылку плиз

MountainGoat Feb 22 2024 at 17:46

InvokeAI, модель JuggernautXL. Инструкции есть на их ютубе. Из неочевидного скажу, что этот тип операций называется inpainting, но при этом модель, созданную для inpainting, использовать не надо - они обучены делать минимально возможное изменение и противостоять перерисовыванию всего целиком.

ShadF0x Feb 23 2024 at 01:23

Из неочевидного скажу, что этот тип операций называется inpainting

Наоборот же, получается outpainting.

MountainGoat Feb 23 2024 at 08:51

Нет. Outpainting это увеличение геометрических размеров изображения, отрисовка за край имеющегося. А я обсуждаю, как сделать пустое изображение и рисовать внутри его границ. Это разные реализации алгоритма.

Cybermorzh Feb 22 2024 at 17:29

Разработчики Stable Diffusion 3 уверяют, что приложили максимум усилий для предотвращения использования модели во вред. Это включает в себя меры безопасности на этапах обучения, тестирования и развертывания модели.

Интересно узнать поподробнее. Модель будет отказываться создавать изображения вирусов, как DALL-E 2, и продвигать расовое разнообразие, как Gemini?

timonin Feb 22 2024 at 17:34

Скорее всего её просто не обучали ни на чем плохом. И в случае с NSFW это просто будут замыленные барби и кены.

Aelliari Feb 22 2024 at 17:41

Но ничто не помешает её дообучить (обучить новую) при наличии вычислительных мощностей, если все останется так как есть на данный момент

timonin Feb 22 2024 at 17:46

Это если модель будет выпущена в открытый доступ.

Aelliari Feb 22 2024 at 17:53

Есть предпосылки того, что в этот раз stability ai не опубликует? Но да, если такое произойдет - будет неприятно

DonkeyHot Feb 24 2024 at 05:51

там скорее-всего встроенные фильтры которые цензурируют внутри модели, они это уже делали во второй версии

7313 Feb 22 2024 at 19:05

It will launch with full ecosystem of tools
It's a new base taking advantage of latest hardware & comes in all sizes
Enables video, 3D & more.
Need moar GPUs..
Боюсь что в этот раз довольно долго не появится никаких автоматиков1111, а родной интерфейс будет как обычно очень убогим. Ну и как бы не заявили 4090 в минимальных требованиях и уж точно вся веселуха будет не для счастливых обладателей обычных видеокарт с 8-12 памяти.

Axelaredz Feb 23 2024 at 10:23

Потому то сами разрабы сидят на ComfyUI :) а не Automatic1111

CodARM Feb 22 2024 at 20:30

Провел я небольшое исследование, и получается что максимальную версию с 8 миллиардами параметров затачивали под 24 гигабайт памяти. То есть нужна либо 4090, либо ждем новое поколение.

В кратце по расчетам, на моей видеокарте sdxl выедает 8 гигов ОЗУ при генерации в разрешении 768х768(3070 8gb, разгрузить максимум видеопамяти та еще морока). Сама sdxl на 3.5 миллиардов параметров. Скорее всего дефолтное разрешение увеличится до 1024х1024 пикселей из чего мы получаем условные 20-24 гигабайта на генерацию.

porn Feb 22 2024 at 20:45

разгрузить максимум видеопамяти та еще морока

Запускайте headless.

7313 Feb 22 2024 at 21:34

Forge и фокус SDXL на 8 гигах в 16:9 вплоть до 2200 точек по широкой стороне генерят. Так что с учетом оптимизаций поменьше наверное памяти будет требовать

MountainGoat Feb 22 2024 at 22:41

Скорее всего дефолтное разрешение увеличится до 1024х1024 пикселей из чего мы получаем условные 20-24 гигабайта на генерацию.

Уже сейчас такое разрешение у SDXL и ей достаточно 12 гб.

All_x_under Feb 23 2024 at 20:36

На 8Гб 1070ti генерю 1024*1024 на фокусе и комфи sdxl

Mike_666 Feb 23 2024 at 10:30

Только б код и вес не зажали...

А уже как починить эту самую *безопасность* сообщество разберется.

Resursator Feb 24 2024 at 10:32

Этот же самый лист ожидания грозится призвать на их сервак дискорда. Кажется, это будет ещё один пример, как открытый продукт ушёл прятаться за пейвол)

Mike_666 Feb 24 2024 at 10:50

Это будет весьма печально...

Gluber Feb 25 2024 at 11:54

Я сейчас на компе использую Fooocus для генерации изображений. И на сколько я знаю, он же основан на стейбле. Интересно, войдут эти новые изменения в фокус?

timonin Feb 25 2024 at 11:54

Fooocus это WebUI для SDXL. Не войдут.