
OpenAI выпустила крупное обновление для генерации изображений внутри ChatGPT.
В основе обновлённого ChatGPT Images лежит новая модель (в API — GPT Image 1.5). Разработчики заявляют о нескольких ключевых улучшениях, которые звучат очень заманчиво.
Точечное редактирование с сохранением контекста. Раньше можно было попросить «добавить шляпу», а модель могла заодно поменять фон, освещение и выражение лица. Теперь же модель должна менять только то, что вы просите, старательно сохраняя исходную композицию, свет и даже внешность людей на фото. Это открывает двери для более реалистичных примерок одежды или причёсок, тонкой ретуши или стилевых фильтров.
Открыть скриншот

Улучшенное следование инструкциям. Модель стала лучше понимать сложные запросы, где важно соотношение объектов. Хотите «кота на книжной полке, который больше вазы, но меньше горшка»? Шансы получить вменяемый результат возросли.
Открыть скриншот

Прорыв в рендеринге текста. Вечная боль генераторов — текст на картинках. OpenAI заявляет, что новая модель справляется с более плотным и мелким текстом лучше предшественницы.
Открыть скриншот

Скорость. Заявлено ускорение генерации до 4 раз. Ждать меньше — творить больше.
Открыть скриншот

Разнообразие типов редактирования. Модель отлично справляется с добавлением, удалением, объединением, смешиванием и перестановкой элементов на изображении.
Открыть скриншот

Стоимость ввода и вывода изображений снижена на 20% по сравнению с GPT Image 1.
Особенно отмечается консистентность при редактировании, что критично для работы с брендами: теперь логотипы и ключевые визуальные элементы должны сохраняться намного лучше. Это делает модель интересной для сферы маркетинга, создания графики и, что важно, для э‑коммерции — можно генерировать целые каталоги товаров (разные ракурсы, сцены) из одного исходного изображения.
Ссылки по теме:
Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.
