Pull to refresh

Comments 28

Потрясающе. Может я отстал, но вот текст всегда был проблемой ранее. Сейчас как будто все очень круто

Да оно сейчас не так уж плохо.

Hidden text

@timonin А есть ли готовые к употреблению (за денежки конечно) сервисы которые могли бы брать фотографию предмета на белом (однородном) фоне...ну например кепки и правильно "вставлять" в фотореалистичное сгенерированное изображение? Ну например берем фото кепки и пишем промт типа: "фотография молодого человека 17-23 лет в кепке, одетого в спортивный костюм без логотипов, стоящего на фоне кирпичной стены и держащего в руках подсолнух"

Есть, но все это работает сложнее, вы говорите про обучение и крайний стартап который пообещал это сделать получил 40 млн инвестиций. Вырезать фон и вставить, увы не достаточно.

Платно не знаю, а бесплатно можно вставить небольшой кусочек на белый фон и сказать сетке додумать всё остальное. Я так из удачно получившегося лица ростовой портрет делал.

Но конечно, чтобы из мятой шапки вид спереди получить надетую и лихо закрученную набок, тут придётся уже много трансформировать вручную.

а не могли бы подсказать что за сервис использовался? Спасибо
PS из-за идиотских правил Хабра не могу часто отвечать... можно в личку ссылку плиз

InvokeAI, модель JuggernautXL. Инструкции есть на их ютубе. Из неочевидного скажу, что этот тип операций называется inpainting, но при этом модель, созданную для inpainting, использовать не надо - они обучены делать минимально возможное изменение и противостоять перерисовыванию всего целиком.

Из неочевидного скажу, что этот тип операций называется inpainting

Наоборот же, получается outpainting.

Нет. Outpainting это увеличение геометрических размеров изображения, отрисовка за край имеющегося. А я обсуждаю, как сделать пустое изображение и рисовать внутри его границ. Это разные реализации алгоритма.

Разработчики Stable Diffusion 3 уверяют, что приложили максимум усилий для предотвращения использования модели во вред. Это включает в себя меры безопасности на этапах обучения, тестирования и развертывания модели.

Интересно узнать поподробнее. Модель будет отказываться создавать изображения вирусов, как DALL-E 2, и продвигать расовое разнообразие, как Gemini?

Скорее всего её просто не обучали ни на чем плохом. И в случае с NSFW это просто будут замыленные барби и кены.

Но ничто не помешает её дообучить (обучить новую) при наличии вычислительных мощностей, если все останется так как есть на данный момент

Это если модель будет выпущена в открытый доступ.

Есть предпосылки того, что в этот раз stability ai не опубликует? Но да, если такое произойдет - будет неприятно

там скорее-всего встроенные фильтры которые цензурируют внутри модели, они это уже делали во второй версии

  • It will launch with full ecosystem of tools

  • It's a new base taking advantage of latest hardware & comes in all sizes

  • Enables video, 3D & more.

  • Need moar GPUs..

    Боюсь что в этот раз довольно долго не появится никаких автоматиков1111, а родной интерфейс будет как обычно очень убогим. Ну и как бы не заявили 4090 в минимальных требованиях и уж точно вся веселуха будет не для счастливых обладателей обычных видеокарт с 8-12 памяти.

Потому то сами разрабы сидят на ComfyUI :) а не Automatic1111

Провел я небольшое исследование, и получается что максимальную версию с 8 миллиардами параметров затачивали под 24 гигабайт памяти. То есть нужна либо 4090, либо ждем новое поколение.

В кратце по расчетам, на моей видеокарте sdxl выедает 8 гигов ОЗУ при генерации в разрешении 768х768(3070 8gb, разгрузить максимум видеопамяти та еще морока). Сама sdxl на 3.5 миллиардов параметров. Скорее всего дефолтное разрешение увеличится до 1024х1024 пикселей из чего мы получаем условные 20-24 гигабайта на генерацию.

разгрузить максимум видеопамяти та еще морока

Запускайте headless.

Forge и фокус SDXL на 8 гигах в 16:9 вплоть до 2200 точек по широкой стороне генерят. Так что с учетом оптимизаций поменьше наверное памяти будет требовать

Скорее всего дефолтное разрешение увеличится до 1024х1024 пикселей из чего мы получаем условные 20-24 гигабайта на генерацию.

Уже сейчас такое разрешение у SDXL и ей достаточно 12 гб.

Только б код и вес не зажали...

А уже как починить эту самую *безопасность* сообщество разберется.

Этот же самый лист ожидания грозится призвать на их сервак дискорда. Кажется, это будет ещё один пример, как открытый продукт ушёл прятаться за пейвол)

Это будет весьма печально...

Я сейчас на компе использую Fooocus для генерации изображений. И на сколько я знаю, он же основан на стейбле. Интересно, войдут эти новые изменения в фокус?

Fooocus это WebUI для SDXL. Не войдут.

Sign up to leave a comment.

Other news