
OpenAI запустила ChatGPT Images 2.0 21 апреля 2026 года. В ChatGPT это новый генератор изображений, а в API основная модель называется gpt-image-2. Обычная генерация в ChatGPT доступна на всех тарифах.
OpenAI делает упор на лучший рендер текста, мультиязычность, более сильное следование инструкции, сложные макеты, редактирование и более уверенную работу с реальными объектами и сценами. В официальных материалах прямо показывают постеры, инфографику, UI-мокапы, комиксы, редакционные развороты и многоязычные изображения.
Отдельно появился режим images with thinking. В нем модель получает больше времени на рассуждение перед генерацией: может лучше распланировать изображение, уточнить визуальную задачу и подключать reasoning, tools и live web search data. То есть если нужно, может подумать над сложной задачей, пере тем как приступить к рисованию.
8 Ключевых возможностей
№ | Возможность | Что это дает на практике |
|---|---|---|
1 | Гибкие размеры до 4K (макс. сторона 3840px) | Популярные: 1024×1024, 2048×2048, 3840×2160, 2160×3840 - без апскейла |
2 | Значительно улучшенный рендеринг текста | Постеры, меню, UI-мокапы, инфографика с читаемыми надписями |
3 | Thinking Mode (reasoning + возможный веб-поиск) | Модель может исследовать контекст, трансформировать входные данные, генерировать варианты и самопроверяться |
4 | Несколько изображений за запрос (параметр | Варианты, сториборды, мультиформатные кампании |
5 | Гибкие соотношения сторон | Баннеры, сторис, постеры - без кропа |
6 | Многоязычный текст | Кириллица, японский, корейский, хинди, арабский, китайский в одном изображении |
7 | Мультиреференсный ввод | Несколько изображений как входные данные (точный лимит официально не указан) |
8 | Структурированная генерация | Диаграммы, инфографика, комиксы, презентации |
Два режима работы
Режим | Кому доступен | Что делает |
|---|---|---|
Обычная генерация | Все планы, включая Free | Быстрая генерация без дополнительного reasoning |
Images with Thinking | Plus, Pro, Business (Enterprise и Edu - скоро) | Reasoning + возможный веб-поиск + самопроверка |
Готовые шаблоны промптов
Если говорить про промпты, официальный совет OpenAI довольно приземленный - должна быть нормальная структура. Рекомендуется писать запрос в понятном порядке - scene/background → subject → key details → constraints - и сразу указывать use case, например: ad, UI mock, infographic. Это полезнее, чем засыпать модель эпитетами типа masterpiece и insane details.
Ниже приведу универсальные шаблоны и правила.
Универсальный шаблон
[СООТНОШЕНИЕ СТОРОН]. [СУБЪЕКТ], [ДЕЙСТВИЕ], [КОНТЕКСТ].
Scene: [где происходит, время суток, фон, окружение]
Subject: [кто или что в центре]
Important details: [материалы, одежда, текстура, освещение, угол камеры, настроение]
Use case: [editorial photo / product mockup / poster / UI screen / infographic]
Constraints: [no watermark / no logos / preserve face / preserve layout]
Шаблон для текстовых элементов
[СООТНОШЕНИЕ СТОРОН]. [СУБЪЕКТ], [КОНТЕКСТ]. Текстовые элементы в кавычках:
Заголовок: “ТОЧНЫЙ ТЕКСТ”Подзаголовок: “ТОЧНЫЙ ТЕКСТ”CTA: “ТОЧНЫЙ ТЕКСТ” [Стилевой якорь - художник/эпоха/медиум]. [Освещение + настроение]. [Камера/объектив + технические параметры].
5 правил, которые реально работают
Соотношение сторон - первым словом: "16:9", "3:1 banner", "1:1 square".
Весь текст - в кавычках: модель воспринимает их буквально.
Конкретный стилевой якорь: "
Editorial fashion photograph, shot on Hasselblad, 90mm, f/2.8" вместо "professional photo".Освещение и настроение - отдельными инструкциями: "
Rembrandt key light from upper-left, soft fill from right, warm tones".Для мультиязычного текста - явно указывать каждый язык: «Title in Japanese (Hiragana): 「春が来た」; subtitle in Korean: '봄이 왔다'».
Антипаттерны (что НЕ работает)
Избегать: stunning, incredible, epic, masterpiece, gorgeous, insane detail.
Предпочитать: overcast daylight, brushed aluminum, chipped paint, 50mm feel, soft bounce light.
Вы дочитали до середины статьи, а значит, статья, вероятнее всего, вам понравилась, как и моя подача и стиль письма, так что вы можете поддержать меня в моем телеграм канале, где уже собрано много полезного и проверенного.
Цены (API)
Модальность | Input | Cached Input | Output |
|---|---|---|---|
Image | $8.00 / 1M токенов | $2.00 / 1M токенов | $30.00 / 1M токенов |
Text | $5.00 / 1M токенов | $1.25 / 1M токенов | $10.00 / 1M токенов |
Для ориентира: генерация одного изображения 1024×1024 в качестве medium обходится примерно в $0.05–0.06.
Сравнение: GPT Image 2 vs Nano Banana 2 vs Nano Banana Pro
Я сразу хочу сказать, что пока модель гораздо менее цензурированная, чем Nano Banana 2 или Nano Banana Pro. Пока эти двое писали мне: “Изображение было отфильтровано, поскольку оно нарушало политику Google ...”, GPT Image 2 просто взял и сделал:

Неизвестно, как долго будет такое послабление в цензуре, так как сначала все модели генерируют почти все, что ни попросишь, а по прошествии времени закручивают гайки.
Сравнение по ключевым параметрам
Параметр | GPT Image 2 | Nano Banana 2 | Nano Banana Pro |
|---|---|---|---|
Макс. разрешение | до 4K (3840px) | 4K нативное | 4K нативное |
Рендеринг текста | Значительно улучшен | Высокий | Высокий |
Reasoning / веб-поиск | Да (Thinking Mode) | Да (image search grounding) | Да (Gemini 3 Pro + Google Search) |
Кол-во изображений за запрос | до 10 (API) | 1–4 | 1–4 |
Мультиреференсный ввод | Да (лимит не указан) | Ограничен | Да |
Скорость (API) | ~40 сек | ~10 сек | ~20 сек |
Доступность | Free / Plus / Pro / API | Gemini Free / Pro | Google AI Pro ($19.99/мес) |
Thinking Mode | Plus, Pro, Business | Через Gemini 3.1 | Через Gemini 3 Pro |
Позиция в лидерборде (Image Arena, апрель 2026)
В arena.ai модель с большим отрывом заняла первое место, причем это еще medium-версия.
Цена за 1000 изображений (API, ориентировочно)
Модель | Цена / 1000 изображений |
|---|---|
Nano Banana (Gemini 2.5 Flash) | ~$39 |
Nano Banana 2 | ~$67 |
Nano Banana Pro | ~$134 |
GPT Image 2 (medium) | ~$50–60 |
Скорость генерации (медиана, API)
Модель | Время |
|---|---|
Nano Banana 2 | ~10 сек |
Nano Banana Pro | ~20 сек |
GPT Image 2 | ~40 сек |
Где каждая модель выигрывает
GPT Image 2 - если важна интеграция с ChatGPT и Codex, мультишаговое редактирование через Responses API, и работа в экосистеме OpenAI.
Nano Banana 2 - лучшее соотношение цена/качество: сопоставимое качество при цене в 2–3 раза ниже и скорости в 4 раза выше.
Nano Banana Pro - если уже используете Google AI Pro и нужна глубокая интеграция с Google-инструментами.
P.S. Вы можете поддержать меня в моем телеграм канале, там я пишу о том, в чем разбираюсь или пытаюсь разобраться сама, тестирую полезные ИИ-сервисы, инструменты для офиса, бизнеса, маркетинга и видео.
