
OpenAI представила новую версию своего генератора изображений DALL-E и объявила о планах интегрировать её в ChatGPT. Разработчики обещают, что DALL-E 3 будет лучше понимать промты и анализировать сложные инструкции, а не смешивать разные элементы подробного запроса, и генерировать «чрезвычайно детальные и точные изображения». У пользователей также появилась возможность составлять промты с помощью ChatGPT.
В описании нейросети OpenAI обещает, что DALL-E 3 намного лучше, чем её предшественница, генерирует картинки по сложным промтам. Модель сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны. DALL-E 3 лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2, отмечают разработчики.

DALL-E 3 позволяет использовать ChatGPT в качестве «партнёра для мозгового штурма» и уточнения промтов. Пользователь сможет попросить ChatGPT составить подробный промт и внести изменения в получившееся изображение, если оно не совсем соответствует запросу.
Сейчас DALL·E 3 находится на стадии исследовательской предварительной версии и будет доступна подписчикам ChatGPT Plus и Enterprise в октябре через API.
«Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения принадлежат пользователю, и ему не требуется разрешение на их перепечатку, продажу или распространение», — уточняют в OpenAI.

В компании также напомнили, что в DALL-E 3 предусмотрены инструменты, ограничивающие генерацию определённых изображений. Например, она будет отклонять запросы с именами общественных деятелей или «вредными предубеждениями», чтобы снизить риск распространения пропаганды и дезинформации. Разработчики также тестируют классификатор происхождения — инструмент, который позволит определить, было ли изображение сгенерировано нейросетью. Наконец, DALL-E не будет генерировать картинки в стиле ныне живущих и творящих художников.
