
Вчера OpenAI представила новую функцию «Изображения в ChatGPT», позволяющую пользователям создавать изображения с помощью модели GPT-4o непосредственно в чате.
Эта функция доступна для всех уровней подписки, включая бесплатный, хотя для бесплатных пользователей существуют ограничения на количество использований. Новая модель, основанная на омнимодальном подходе, значительно улучшает привязку атрибутов и отображение текста в создаваемых изображениях по сравнению с предыдущими моделями. Это позволяет более точно и надежно создавать сложные изображения и связные тексты.
Модель очень хорошо держит контекст между фо��ографиями, консистентно модифицирует изображения, сохраняя лица персонажей. Позволяет добавлять или удалять информацию на изображения загруженные пользователями. Модель неплохо улучшает качество изображений, удаляет водяные знаки, меняет стили фотографий и даже может редактировать изображения идентификационных документов.

Система использует авторегрессионный подход для постепенного создания изображений, что способствует лучшему отображению текста и привязке атрибутов, хотя и увеличивает время генерации.
OpenAI подчеркивает наличие надежных мер безопасности для предотвращения злоупотреблений и гарантирует, что созданные изображения включают цифровые C2PA маркеры, указывающие на их искусственное происхождение. Пользователи полностью владеют этими изображениями в рамках политики использования сервиса.
На рынке уже существуют модели, позволяющие редактировать изображения с поразительным качеством. Но судя по всему, Open AI показывают совершенно новый уровень, поражающий своей реалистичностью. Reddit просто бурлит фотографиями разных мастей, сгенерированных сообществом.
