Google выпустила Nano Banana 2 (в API — Gemini 3.1 Flash Image) — новую модель генерации и редактирования изображений, которая сочетает возможности топовой Nano Banana Pro с быстродействием линейки Flash. Модель уже раскатывается в Gemini App, Google Search, AI Studio, Vertex AI и конструкторе Flow, где доступна полностью бесплатно.

Среди ключевых улучшений — расширенные "знания о мире": модель использует базу знаний Gemini и данные из веб-поиска, чтобы точнее рисовать конкретные объекты, места и людей. Nano Banana 2 умеет генерировать читаемый текст на нескольких языках, включая локализацию надписей прямо на изображении, а также создавать инфографику и диаграммы. Разрешение — от 512 пикселей до 4K, с поддержкой различных соотношений сторон.

Отдельно Google подчеркивает консистентность персонажей: модель удерживает облик до 5 героев и 14 объектов в рамках одного сценария — это позволяет строить визуальные нарративы и сториборды без потери узнаваемости. Улучшено и следование инструкциям: по заявлению Google, модель точнее выполняет сложные многоступенчатые запросы.

В Gemini App Nano Banana 2 заменяет Nano Banana Pro для моделей Fast, Thinking и Pro. Подписчики AI Pro и Ultra сохранят доступ к оригинальной Pro-версии через меню перегенерации. В Google Search генерация картинок с помощью новой модели появилась в AI Mode и Lens, причем сразу в 141 стране. В Flow — конструкторе визуального контента Google — модель стала дефолтной и не расходует кредиты.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.