Nano Banana 2: обзор генератора изображений от Google, тесты и сравнение с конкурентами / Хабр

Разбираем возможности новой модели генерации изображений Nano Banana 2 от Google. Сравнение с Nano Banana Pro, реальные тесты, плюсы и главные ограничения. Способы использования в России.

Нейросеть для генерации изображений Nano Banana 2

Google представила Nano Banana 2 — новую модель генерации изображений, которая призвана изменить баланс между скоростью работы и качеством визуального контента. Нейросеть базируется на архитектуре Gemini Flash, предлагая пользователям фотореалистичный рендеринг и точное следование промптам. В этой статье мы детально разберем возможности новинки, результаты тестов и способы доступа к ней.

🍌 Попробовать новую нейросеть от Google Nano Banana 2

Что такое Nano Banana 2 и как она работает

Техническое название новой нейросети — Gemini 3.1 Flash Image. Концепция Google заключается в том, чтобы сделать продвинутые функции генерации и редактирования фото доступными для массового использования за счет высокой скорости отклика.

Ключевые отличия от оригинальной Nano Banana

По сравнению с первым поколением, новая модель получила серьезный апгрейд алгоритмов обработки визуальных данных.

По сравнению с первым поколением, новая модель Nano Banana 2 (Gemini 3.1 Flash Image) получила серьезный апгрейд алгоритмов обработки визуальных данных и значительное расширение функционала.

Стабильность объектов и работа с референсами (Subject consistency): Это одно из самых важных нововведений для создателей контента. Нейросеть способна сохранять стопроцентную узнаваемость до пяти персонажей и точность деталей до четырнадцати объектов (в приложении Gemini — до десяти) в рамках одного рабочего процесса. Модель опирается на ваши исходные данные (inputs) и не меняет их в��ешний вид от кадра к кадру, что делает её идеальным инструментом для раскадровок и комиксов.
Качество и фотореализм (Visual fidelity upgrade): Значительно улучшена проработка освещения, детализация мелких элементов, появились более богатые текстуры. Картинки сохраняют эстетику высокого качества даже при генерации на высоких скоростях Flash-архитектуры.
Точное следование сложным инструкциям (Precise instruction following): Модель намного точнее обрабатывает многосоставные промпты. Она улавливает специфические нюансы вашей идеи, которые раньше игнорировались алгоритмом, выдавая именно то изображение, которое вы задумывали.
Идеальный рендеринг текста и локализация (Precision text rendering): Огромный шаг вперед для дизайнеров и маркетологов. Nano Banana 2 умеет генерировать точный и читаемый текст на макетах, инфографике или открытках. Более того, нейросеть способна переводить и локализовать этот текст прямо внутри изображения без потери оригинального стиля.
Разрешение до 4K (Production-ready specs): Появился полный контроль над соотношением сторон и итоговым разрешением. В зависимости от платформы доступа, генерация поддерживается от 512px вплоть до 4K (пользователям Workspace доступно 2K, бесплатным аккаунтам — 1K).
Продвинутое знание мира (Advanced world knowledge): Модель интегрирована с базой знаний Gemini и поисковиком Google. Она подтягивает информацию и референсы из сети в реальном времени, чтобы максимально достоверно отрисовывать конкретные исторические объекты, локации или предметы. Глубокое понимание контекста также позволяет ей превращать текстовые заметки в сложные графики и визуализации данных.

Сравнение с Nano Banana Pro: скорость против мощности

Хотя Pro-версия остается флагманским решением для задач, требующих максимальной фактической точности, вторая «Банана» становится отличной альтернативой для ежедневной работы.

Скорость генерации: Новинка работает на скоростях Flash-архитектуры, что позволяет моментально вносить правки и перерисовывать картинки.
Позиционирование в экосистеме: Вторая версия стала моделью по умолчанию в большинстве сервисов Google, заменив Pro в режимах Fast, Thinking и Pro. Доступ к Nano Banana Pro сохраняется у платных подписчиков для узкоспециализированных задач.

Возможности Nano Banana 2 при создании изображений

Функционал модели выходит далеко за рамки простой отрисовки картинок по тексту. Разработчики внедрили ряд инструментов, которые делают ИИ полноценным помощником для дизайнеров и маркетологов.

Интеграция с базой знаний Google: Нейросеть имеет доступ к поисковику в реальном времени. Если запросить генерацию реально существующего объекта или локации, модель сначала изучит референсы из сети, чтобы обеспечить максимальную достоверность деталей.
Рендеринг и перевод текста: Ген��ратор отлично справляется с написанием читаемого текста на макетах и инфографике. Более того, доступна функция локализации — текст можно перевести на другой язык прямо внутри сгенерированной картинки.
Высокое разрешение до 4K: Пользователи могут гибко настраивать соотношение сторон. В бесплатном доступе картинки генерируются в 1K, для платных подписчиков Workspace — в 2K, а через API можно получить полноценные 4K-изображения.
Маркировка SynthID: Для борьбы с дипфейками в модель вшита технология SynthID в связке с C2PA Content Credentials. Метаданные файла надежно хранят историю того, как именно создавалось и редактировалось изображение.

Тесты и бенчмарки: данные Artificial Analysis Image Arena

Чтобы оценить реальную производительность новинки, стоит обратиться к независимым метрикам и сравнениям с лидерами рынка. Согласно данным платформы Artificial Analysis Image Arena, новая модель от Google DeepMind показывает выдающиеся результаты в своем классе.

Место	Разработчик	Название модели	ELO-рейтинг	Погрешность (95% ДИ)	Количество тестов	Дата выхода	Цена API (за 1000 шт.)
1	Google	Nano Banana 2 (Gemini 3.1 Flash Image Preview)	1 272	-15/15	2 721	Февраль 2026	$67.0
2	OpenAI	GPT Image 1.5 (high)	1 268	-12/12	3 935	Декабрь 2025	$133.0
3	Google	Nano Banana Pro (Gemini 3 Pro Image)	1 220	-13/13	2 991	Ноябрь 2025	$134.0
4	Black Forest Labs	FLUX.2 [max]	1 206	-13/13	3 000	Декабрь 2025	$70.0
5	Black Forest Labs	FLUX.2 [pro]	1 192	-14/14	2 608	Ноябрь 2025	$30.0
6	ByteDance Seed	Seedream 4.0	1 188	-7/7	9 316	Сентябрь 2025	$30.0
7	Black Forest Labs	FLUX.2 [flex]	1 178	-14/14	2 602	Ноябрь 2025	$60.0
8	xAI	grok-imagine-image	1 176	-10/10	4 333	Январь 2026	$20.0
9	Google	Imagen 4 Ultra	1 174	-12/12	3 242	Июнь 2025	$60.0
10	ByteDance Seed	Seedream 4.5	1 174	-10/10	5 155	Декабрь 2025	$40.0

В категории генерации по тексту (Text to Image) Nano Banana 2 заняла уверенное 1-е место. В сегменте редактирования изображений (Image Editing) модель вошла в тройку лидеров, заняв 3-е место и уступив лишь старшей версии Nano Banana Pro (Gemini 3 Pro Image) и модели GPT Image 1.5.

Особого внимания заслуживает экономика использования API. Стоимость генерации 1000 изображений в Nano Banana 2 составляет $67. Это ровно в два раза дешевле, чем у Nano Banana Pro ($134 за 1k) и конкурентного GPT Image 1.5 ($133 за 1k). Новинка также уверенно обходит в цене FLUX.2 [max], где стоимость генерации для редактирования достигает $140 за 1000 картинок. Таким образом, новая Flash-модель предлагает одно из лучших на рынке соотношений цены и качества.

Ограничения модели: на что жалуются пользователи

Несмотря на впечатляющие бенчмарки, первые тестировщики на Reddit выявили ряд технических недочетов. Практическое использование показало, что генератору еще есть куда расти.

Отсутствие альфа-канала: Модель пока не умеет выдавать изображения с прозрачным фоном (в формате PNG). Чтобы вырезать объект, пользователям приходится просить сгенерировать фон в стиле хромакея (зеленый экран) и удалять его в сторонних графических редакторах.
Сложности с арт-стилями и референсами лиц: Художники отмечают, что генерация в специфических художественных жанрах (например, синтетический кубизм) зачастую получается слабой и не передает суть стиля. Кроме того, при загрузке фото реального человека модель хуже сохраняет черты лица по сравнению с некоторыми предыдущими нейросетями.
Игнорирование размеров и лимиты: При пакетной генерации с разными требованиями к разрешению ИИ может сбиваться. Также пользователи заметили резкое снижение суточных квот — лимит бесплатных генераций упал с 1000 примерно до 100 в день.

Как общаться с Nano Banana 2: забудьте про теги, пишите сценарии

Главная ошибка при переходе на Nano Banana 2 с других генераторов изображений — попытка общаться с ней старыми «заклинаниями». Если ваш опыт строился вокруг Midjourney или Stable Diffusion, вы наверняка привыкли к специфическому синтаксису: обрывистым токенам, бесконечному перечислению стилей через запятую, весам и техническим костылям вроде --ar 16:9 или объемным негативным промптам.

Поскольку «под капотом» Nano Banana 2 работает мощная LLM от Gemini, система воспринимает не машинный код, а живой язык. Вы больше не оператор базы данных — вы режиссер-постановщик.

Вот как нужно перестроить подход к промптингу:

Литературные описания вместо списков. Забудьте про шаблонные улица, ночь, 8k, шедевр, unreal engine, cinematic. Чтобы получить по-настоящему глубокий кадр, пишите связный текст. Вместо сухого перечисления лучше задать сложную атмосферу: «Мрачный Петербург XIX века, узкий двор-колодец. Идет тяжелый мокрый снег. На переднем плане стоит бледный студент в потертом старом пальто, его взгляд напряжен и полон тяжелых сомнений. Тусклый желтоватый свет из окна падает на мокрую брусчатку, создавая густые, тревожные тени». Модель отлично поймет этот психологизм, исторический контекст и драматургию сцены.
Физика и сюжет важнее тегов. Нейросеть прекрасно считывает пространственные и физические взаимосвязи. Если вы создаете сложную композицию, опишите механику взаимодействия: как именно падает свет, как ткань ложится на фигуру или как объекты перекрывают друг друга.
Управление форматом через текст. Технические ключи больше не нужны. Требования к картинке органично вплетаются в запрос: «сделай широкоформатное изображение 16:9 для обложки видео» или «нарисуй это в виде вертикальной книжной иллюстрации».
Режиссура «на лету». Благодаря скорости Flash-модели и способности удерживать контекст беседы, идеальный промпт с первого раза писать необязательно. Сгенерировав базу, можно просто попросить: «Сделай тени более глубокими, а свет из окна — холодным», и алгоритм корректно обновит сцену, сохранив общую композицию.

Такая специфика избавляет от необходимости подбирать правильные веса для слов. Вы ставите задачу так, как объясняли бы ее живому художнику или оператору на съемочной площадке.

Тесты Nano Banana 2

Тест 1: Ультрареалистичный портрет, макродетализация и глубина взгляда

Что проверяем: Google заявляет о значительном улучшении визуальной точности, богатых текстурах и резких деталях в Nano Banana 2. Этот промпт — самый жесткий тест для этих заявлений. Он требует от модели идеального рендеринга сложной анатомии глаза (радужка, блики), текстуры кожи без «пластикового» эффекта и правильной работы с естественным светом.

Промпт:

Крупноплановый, предельно детализированный фотопортрет молодой девушки лет двадцати, стоящей у окна в пасмурный день. Лицо повернуто к камере, взгляд прямой и пронзительный. У неё невероятно красивые, большие и глубокие голубые глаза, в радужке которых виден сложный рисунок из более темных и светлых радиальных полос, а также четкий, естественный блик от окна. Кожа лица выглядит абсолютно естественно: видны мельчайшие поры, легкий пушок, едва заметные веснушки на переносице и естественный здоровый блеск, без эффекта «пластиковой кожи». Несколько непослушных прядей её русых волос слегка выбились из прически и застыли у лица, подчеркивая реализм. Освещение мягкое, рассеянное, дневное. Глубина резкости предельно малая: в фокусе только глаза и центральная часть лица, а задний план размыт в мягкое, кремовое боке. Снято на полнокадровую камеру с объективом 85mm f/1.4, видна легкая естественная зернистость пленки. Ультрареализм, фотокачество 4K.

Тест 2: Взаимодействие персонажей и анатомия (Тест следования инструкциям)

Что проверяем: Точное следование инструкциям и стабильность объектов при взаимодействии. Модели часто ломаются, когда два человека физически контактируют (передача предметов, сплетение рук).

Промпт:

Документальная уличная фотография, снятая на пленку 35мм. Яркий солнечный день на шумном фермерском рынке. Пожилой мужчина с глубокими морщинами на лице, одетый в выцветшую вельветовую рубашку, добродушно улыбается. Он протягивает коричневый крафтовый пакет, доверху наполненный красными яблоками, маленькой девочке в ярком желтом комбинезоне. Девочка стоит на цыпочках и тянется за пакетом, крепко обхватывая его обеими руками. Пальцы мужчины и девочки не сливаются, анатомия рук идеальная. На заднем плане в мягком фокусе видны деревянные прилавки с овощами и проходящие мимо люди. Естественное дневное освещение, теплые оттенки, легкое зерно пленки.

Тест 3: Монументальная скульптура и драматичный масштаб

Что проверяем: Способность найти и верно отобразить один из самых высоких монументов в мире со сложной динамичной позой. Тестируем, как модель справится с рендерингом бетонной поверхности, развевающейся одежды и интеграцией исполинской статуи в ландшафт Мамаева кургана, а также с передачей драматичного освещения.

Промпт:

Драматичный, низкоракурсный снимок монумента «Родина-мать зовёт!» на Мамаевом кургане в Волгограде. Камера направлена вверх, подчеркивая исполинский масштаб статуи и ее мощный порыв. Фигура женщины с мечом доминирует над небом, полным тяжелых, грозовых облаков. Заходящее солнце пробивается сквозь тучи, окрашивая бетонную поверхность статуи и края облаков в тревожные оранжевые и красные тона. На дальнем плане, у подножия холма, видны огни города Волгограда и Волга, снятые в мягком фокусе. На массивном постаменте четко видна надпись на русском языке: "РОДИНА-МАТЬ ЗОВЕТ!". Качество эпического кинематографического кадра, высокая детализация фактуры бетона и драпировки.

В общем получилось не плохо, но версия Pro лучше справилась с передачей масштаба и выбран более удачный ракурс.

Тест 4: Микроскопическая детализация и текстуры (Тест визуальной точности)

Что проверяем: Заявленное улучшение визуальной точности, включая более богатые текстуры и резкие детали. Этот запрос заставит нейросеть работать с макросъемкой, геометрией и физикой отражения света от разных материалов.

Промпт:

Экстремальная макрофотография процессорного сокета на современной компьютерной материнской плате. Тончайшие золотые ножки контактов ярко блестят под холодным, жестким студийным светом, подчеркивая идеальную математическую геометрию. На краях черного матового текстолита видна микроскопическая фактура стекловолокна. Глубина резкости предельно малая: в фокусе только центральная часть сокета, а задний план красиво размыт в технологичное боке из серебристых конденсаторов и медных дорожек платы. Высочайший уровень фотореализма, снято на макрообъектив 100mm.

Тест 5: Эпический масштаб и композиция (Тест работы с пропорциями)

Что проверяем: Способность модели выдавать «продакшен-качество» с полным контролем над соотношением сторон, а также умение выстраивать масштабные, кинематографичные фэнтези-сцены без потери детализации на общих планах.

Промпт:

Панорамный кинематографичный кадр эпического масштаба с соотношением сторон 21:9. Огромный древний город, высеченный прямо в толще отвесной серой скалы у подножия бушующего водопада. Архитектура циклопическая: массивные каменные арки и подвесные деревянные мосты, перекинутые через бездонную пропасть. Раннее холодное утро, густой белый туман стелется по дну ущелья. Первые лучи солнца пробиваются сквозь водяную пыль от водопада, создавая едва заметную радугу. На ближайшем деревянном мосту стоит крошечная фигура путника в сером дорожном плаще с длинным посохом, что подчеркивает исполинские, подавляющие размеры скального города.

Протестировать Nano Banana 2

Как пользоваться Nano Banana 2 из России

Доступ к передовым западным нейросетям для российских пользователей традиционно сопряжен с рядом серьезных препятствий. Официально сервисы генеративного ИИ от Google в РФ заблокированы.

Напрямую открыть веб-версию Gemini или использовать инструменты Workspace из-за региональных ограничений не получится. Использование стандартных VPN-сервисов также помогает далеко не всегда. Кроме того, легально оплатить доступ к расширенным функциям или API с помощью российских банковских карт невозможно.

Оптимальным решением для стабильной работы и интеграции нейросети в свои проекты становятся специализированные шлюзы, работающие по API. Одним из таких проверенных сервисов является Study AI. Подобные агрегаторы позволяют оплачивать доступ в рублях российскими картами и использовать мощности топовых моделей без необходимости настройки сложных схем обхода блокировок.

Официальные сервисы Google для работы с Nano Banana 2

Для пользователей, решивших проблему с доступом, компания уже развернула модель на большинстве своих платформ. Интеграция произошла практически во всю рабочую экосистему.

Приложение Gemini и Google Workspace: Модель стала вариантом по умолчанию для генерации визуала.
API и AI Studio: Разработчики могут интегрировать нейросеть через официальный Gemini API и Vertex AI.
Google Поиск: Функция работает в AI Mode и при использовании умного поиска Google Объектив.
Google Flow: В этом сервисе модель работает по умолчанию и пока не требует траты кредитов.
Google Ads: Маркетологи могут применять нейросеть для быстрого создания рекламных креативов в кампаниях.

Nano Banana 2: обзор генератора изображений от Google, тесты и сравнение с конкурентами

Что такое Nano Banana 2 и как она работает

Ключевые отличия от оригинальной Nano Banana

Сравнение с Nano Banana Pro: скорость против мощности

Возможности Nano Banana 2 при создании изображений

Тесты и бенчмарки: данные Artificial Analysis Image Arena

Ограничения модели: на что жалуются пользователи

Как общаться с Nano Banana 2: забудьте про теги, пишите сценарии

Тесты Nano Banana 2

Тест 1: Ультрареалистичный портрет, макродетализация и глубина взгляда

Тест 2: Взаимодействие персонажей и анатомия (Тест следования инструкциям)

Тест 3: Монументальная скульптура и драматичный масштаб

Тест 4: Микроскопическая детализация и текстуры (Тест визуальной точности)

Тест 5: Эпический масштаб и композиция (Тест работы с пропорциями)

Как пользоваться Nano Banana 2 из России

Официальные сервисы Google для работы с Nano Banana 2

Публикации

Информация