Как стать автором
Обновить

Google анонсировала Imagen 3 — нейросеть для генерации изображений по текстовому описанию

Время на прочтение1 мин
Количество просмотров3.9K

На портале arXive команда исследователей Google анонсировала модель машинного обучения Imagen 3, предназначенную для генерации изображений по текстовому описанию. Она заменит собой прошлую версию и будет доступна в сервисе ImageFX.

Нейросеть Imagen 3 по умолчанию создаёт изображения с разрешением 1024×1024 пикселей. При этом есть возможность увеличить разрешение в 2, 4 и 8 раз. В компании считают, что Imagen 3 лучше других моделей на рынке справляется с созданием фотореалистичных картинок и может обрабатывать длинные запросы с обилием деталей.

Изображения в разрешении 4K (12 МП), созданные с помощью Imagen 3
Изображения в разрешении 4K (12 МП), созданные с помощью Imagen 3

Для датасета использовали уникальные изображения, которые прошли через несколько фильтров. В первую очередь из набора данных убрали небезопасные и жестокие картинки, а после удалили низкокачественные файлы. Кроме того, инженеры внимательно следили, чтобы в датасет не попали сгенерированные изображения. К каждой картинке добавили текстовое описание.

Примеры работ Imagen 3
Примеры работ Imagen 3

В ближайшее время Imagen 3 появится на платформе ImageFX от Google. Доступ к самой платформе пока есть только у жителей США. Всем остальным пользователям необходимо зарегистрироваться в очереди и ждать, когда компания расширит географию сервиса.

Теги:
Хабы:
Если эта публикация вас вдохновила и вы хотите поддержать автора — не стесняйтесь нажать на кнопку
Всего голосов 3: ↑3 и ↓0+8
Комментарии0

Другие новости

Работа

Data Scientist
46 вакансий

Ближайшие события