От текста к ИИ-миру за секунды: Google запустила публичный доступ к Genie 3 / Хабр

Google открыла Project Genie — экспериментальный прототип на базе модели мира Genie 3, который позволяет создавать интерактивные 3D-окружения из текстовых описаний и изображений. Доступ получили подписчики Google AI Ultra в США (от 18 лет), стоимость подписки — $250 в месяц. В Google DeepMind рассматривают модели мира как ступень к AGI: они позволяют тренировать ИИ-агентов в бесконечном количестве симуляций.

Project Genie работает как веб-приложение с тремя режимами. В режиме "создания мира" пользователь описывает сцену текстом или загружает изображение, выбирает персонажа и перспективу (от первого или третьего лица). Интеграция с генератором изображений Nano Banana Pro позволяет предварительно просмотреть и подкорректировать мир до запуска. В режиме исследования Genie 3 генерирует окружение в реальном времени по мере движения — 24 кадра в секунду при разрешении 720p. Третий режим — ремиксы: можно взять чужой мир из галереи и переработать его под свои промпты.

Технически Genie 3 — это модель мира, которая симулирует физику и динамику среды, предсказывая, как действия пользователя повлияют на окружение. В отличие от статичных 3D-снимков, система генерирует путь "на лету". Ключевое достижение — визуальная память: модель сохраняет консистентность сцены несколько минут, тогда как у предшественника Genie 2 большинство демонстраций длились лишь 10–20 секунд.

Ограничений пока хватает: миры не всегда соответствуют промптам или реальной физике, персонажи иногда плохо управляются, а максимальная длительность сессии — 60 секунд. Функция динамических событий (смена погоды, появление объектов по ходу исследования), анонсированная в августе 2025-го, в прототип пока не вошла.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

От текста к ИИ-миру за секунды: Google запустила публичный доступ к Genie 3

Другие новости

Ближайшие события