Подразделение Alibaba, занимающееся разработкой искусственного интеллекта, Qwen, выпустило новую модель редактирования изображений, которая разбивает фотографии на отдельные редактируемые компоненты. Qwen-Image-Layered разделяет изображения на несколько отдельных слоев с прозрачным фоном (слои RGBA), позволяя пользователям редактировать каждый слой независимо, не затрагивая остальную часть изображения.

Модель позволяет выполнять простые операции редактирования, такие как изменение размера, положения и цвета отдельных элементов. Пользователи могут менять фон, заменять людей, изменять текст, а также удалять, перемещать и увеличивать объекты. Изображения можно разделить на 3 или 8 слоев, и этот процесс повторяем - каждый слой можно разбить на дополнительные слои по мере необходимости. Команда Qwen описывает этот подход как мост между стандартными изображениями и структурированными, редактируемыми представлениями.

Команда Qwen опубликовала код на GitHub, а модели доступны на платформах Hugging Face и ModelScope . Более подробная информация содержится в сообщении в блоге и техническом отчете . Для практического тестирования доступны демо-версии на платформах Hugging Face и ModelScope .


Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.

Источник