Как стать автором
Обновить

У вас новый ремонт? Лучше! Рисунок нового ремонта. Как мы из Stable Diffusion сделали дизайнера интерьеров

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров13K
Всего голосов 29: ↑26 и ↓3+30
Комментарии38

Комментарии 38

Идея интересная.
Правда что-то пропорции и размеры мебели не вяжутся с реальностью размера комнаты.

Вот тоже показалось будто комната стала будто-бы "больше" чем она на фото до ремонта

Конечно, сейчас, генерация - это, скорее, про фантазию и вдохновение: помимо размеров еще куча артефактов и других мелочей, к сожалению.

В целом, в статье про это сказано и можно попробовать добиться более хороших результатов подкруткой параметров или подгонкой исходного изображения.

Чтож, будем стараться улучшать :)

нет слоя штукатурки выравненного по маячкам

нет пирога напольного покрытия

высота потолка увеличилась, с учетом глубины посадки ламп

еще и стеклопакет весь заменили

не дай бог "такое" увидит жена, потом хрен докажешь что такое невозможно.

А главное - газовая труба со счетчиком на дальней стене! С ними что-то сделать - это же боль. Нет, это БОЛЬ. А тут рррраз - и нет труб) AI - сила!
Впрочем, это явно кухня а дизайн под гостиную, наверно неудачный пример помещения.
Иначе, где гарнитур-то? Видимо справа за углом пара модулей на 60) Чисто руки помыть и винишко открыть, а еду можно и в ресторанах заказать (вот это жена точно одобрит)

Ждем бригады, состоящие из роботов под управлением AI. Приходишь проверить ремонт - а трубы у стены нет, ее удлинили на 200 метров, она выходит в окно, проходит через крышу, заходит с другой стороны дома обратно в квартиру, и еще рядом стоят соседи сверху с вопросом, почему кто-то перенес их пол на метр выше

Зато пейзаж за окном поприятнее стал)

Осталось, чтобы ещё чертежи генерировала.

Это не за горами 😉

И всю документацию!

Это уже к коллегам по NLP, скорее)

Лучше смету. С финальной цифрой.

И чтобы потом нейронка и отвечала, если план-факт не сойдётся

И инженерные системы, с расчетам и как их проводить вот под всю эту красоту, с чётом материалов :D

Суровая нейрошиза. Сколько пальцев я показываю нейросеточка? Что с ножками?

А как источник вдохновения мясного дизайнера вполне ок.

Кожаные еще борются 💪🏻

Классно, какой-то доступ для не сотрудников не планируется?

Сложно сказать, пока работаем над сервисом.

Если предлагать не только сотрудникам, то это больше ответственности, а значит, больше работы и времени 🙈

Ждём наплыв фейковых ремонтов на всяких Авито.

🙈

В результате Canny можно очень просто отфильтровать мусор. Из результата Canny делаем преобразование Хафа (Hough transform). В результате Хафа берем только пики (threshold) и из них делаем обратное преобразование. Результат обратного Хафа обьединяем с результатом Canny по AND. Таким образом можно получить только линии длинны больше threshold-а. Если результат не устроит - можно рисовать обратное преобразование Хафа линиями большей ширины или чуть-чуть его разблурить. Мне кажется это лучше позволит сохранить геометрию комнаты.

https://docs.opencv.org/3.4/d9/db0/tutorial_hough_lines.html

так же можно попробовать заменить Canny на оператор Собеля или Шаара с threshold-ом.

100% как вариант

Пробовали что-то такое. Получались какие-то засечки/линии, которые непредсказуемо перемещались в зависимости от входного изображения и трешхолдов для алгоритмов. Пришлось ручками подбирать это все для каждого изображения индивидуально - плохая автоматизация... Да и хочется что-то более явное: вот потолок, вот стена, вот пол, вот грязная плитка с узором, которую не надо брать во внимание (или ковер во всю стену). Но тут, конечно, надо более продвинутые подходы рассматривать, что-то с сегментацией.

Честно говоря, не знаю насколько это практично.

Я заказывал дизайн в магазине. Просто прислал им тех. паспорт на квартиру. И они сделали мне несколько вариантов исключительно из тех материалов, что есть у них, вместе со сметой. Плитка, обои, линолеум, двери, мебель и т.п. Все как я и просил — никаких абстрактных фантазий дизайнера, которые потом не смогут реализовать ни мастера без перепланировки, ни я без изготовления по индивидуальному заказу.

Очень удобно. Вплоть до того, что можно было подобрать рисунок на углах и стыках плитки — "фартук" над кухонным столом с мелким рисунком вписался идеально. Плиточник был доволен, что ему не пришлось голову ломать.

Кажется, наш сервис лишь сильно упростит работу дизайнеру, чтобы начать работу не с чистого холста. А так, да, в вашем случае, все равно пока нужен человек и более точные инструменты.

Будем развиваться с учетом таких потребностей!

А где это? Город, магазин.

И давно ли это было? Коробит про ленолеум.

можете картинки приложить что сделали в магазине?

Считаю модель Dreamlike работает лучше всего, пользуюсь ее уже некоторое время и очень довольна работой. Я как то пробовала и другие модели, но не то.

Боюсь, что Dreamlike - это лишь сервис, который предлагает удобный интерфейс взаимодействия. Если я не ошибаюсь, то вид моделей для генерации он использует ровно такой же 🤔

А они в начале карточки самой пишут: "Dreamlike Photoreal 2.0 is a photorealistic model based on Stable Diffusion 1.5, made by dreamlike.art."

Так что, строго говоря, это докрученный sd, все-таки 🤓

Ну технически почти любая моделька - это докрученная SD. Даже популярный Deliberate или Anything

Не ну тут вопрос подхода - всё это диффузионные модели (картинка из статьи с GAN vs VAE vs Diffusion based models). Одна из реализации этого подхода - Stable Diffusion (самая ходовая - от diffusers или stability.ai). Другая - Kandinsky, третья - DALL-E, следующая - Midjourney и пр.

Реализация Stable Diffusion качественно выделяется из других, т.к. она опенсурс - с открытым кодом и лицензией. Поэтому, бери это за основу да делай (=плоди) тыщу других версий с минимальными телодвижениями с собственными лицензиями.

Итого имеем: да, действительно, большинство это просто докрученная SD, но, все-таки, это не единственная реализация, на которую могут опираться разработчики.

Респект команде, отличная работа проделана.

Помню на каком-то из этапов Лидеров России за нашим столом мы такую идею раскручивали. Клиент рисует простенькую схему помещения и накидывает набор фото текущего состояния. В MVP сервис просто шерстит интернет, ищет наиболее подходящие картинки с ремонтом и выдает их клиентам. Дальше как раз внедрение нейросейтей, чтобы генерировать картинку, более совпадающую с квартирой клиента. Потом построение 3d модели квартиры с возможностью её вращать, переставлять предметы.

Прорабатывали и монетизацию. Внедрение в картинку реальных объектов (мебель, покрытия, фурнитура, техника) из каталогов партёров. Картинки клиентам выгружать с метками для перехода в соответсвующий каталог. % от партнёров.

Платные функции для клиентов. Детальные схемы расстановки мебели и описанием ремонта. Сметы. Выгрузки списков всех материалов, мебели со ссылками по каталогам магазинов и стоимостями.

После брейншторма организаторы конкурса аккуратно сложили все нашими материалы в коробки и куда-то унесли. ))

Спасибо!)

У вас топовые идеи, которые заслуживают внимания. Стараемся тоже прикручивать такого рода фичи, но, лучше, пожалуй, сделать качественно, но не первыми, чем первыми, но некачественно (с) Стэтхэм

Есть же ComfyUI, можно выстроить в ней любую цепочку любых контролнетов, найти лучший вариант, а потом захардкодить. Но все же пока это только для мудбордов, оно не понимает размеров, не умеет в зонирование и вообще не знает что делает) так что кожаный дизайнер никуда не денется)

https://youtu.be/4YxZ0Iw27M0?si=QB_yyuD6Vcwc6lx1

Дада, всё так. Но ComfyUI - это сложный инструмент уровня аля фотошоп наших дней. Кто им владеет, тот крутой перец.

Полностью согласен, что кожаные еще нужны и даже вне конкуренции пока. Посмотрим, что предложит нам некстген ген аи)

Очень классный канал по comfyui https://www.youtube.com/@latentvision как раз недавно вышла 3 часть from 0 to hero

Классная работа проделана, итоги по отзывам и использованию впечатляют

Если будете в будущем какие-то ещё проекты на SD делать, попробуйте инструмент HiDiffusion: https://hidiffusion.github.io/

Фактически это надстройка над SD, меняющая некоторые внутренние операции нейросети, позволяющая использовать её для разрешений бо́льших, чем обучающий датасет. Я спокойно с HiDiffusion генерирую на 1.5 изображения 1920×1080 локально, бо́льших размеров мне скорее железо не позволяет в разумное время генерировать результат. А использовать SD 1.5 сильно удобнее из-за того, что его всё ещё активно файнтюнят под разные задачи и эту модель сильно проще обучать по времени

Спасибо, примем к сведению!)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий