NeyroEntuziast 21 мая в 09:16

Google представила ИИ-генератор видео Veo 3

Простой

6 мин

57K

Искусственный интеллектМашинное обучение*Будущее здесьРабота с видео*

Обзор

Перевод

Автор оригинала: Jim Clyde Monge

Если Veo 2 произвел на вас впечатление, то Veo 3 вас просто поразит.

Google IO 2025 завершилась, и это была абсолютная масса анонсов в сфере ИИ. Многие люди, включая меня, до сих пор поднимают челюсти с пола. Но из всех анонсов Veo 3 - один из самых захватывающих для меня.

Об остальных анонсах я расскажу в отдельном посте, а пока давайте сосредоточимся на новейшей генеративной видеомодели Google.

Что нового в Veo 3

Вот краткий обзор основных обновлений:

Улучшено качество и физический рендеринг при генерации видео по текстовым и графическим промптам
Большее разрешение при выводе в 4K
Улучшенное соблюдение промптов, что означает более точные ответы на ваши инструкции
Автоматическое добавление речи, например, диалогов и закадрового голоса.
Встроенная функция генерации звука, например музыки и звуковых эффектов.

Да, Veo 3 теперь может автоматически добавлять диалоги. Для меня это самая потрясающая функция из всех. Вероятно, она стала возможной благодаря работе DeepMind над созданием искусственного интеллекта для преобразования видео в аудио, о которой было объявлено в июне прошлого года.

Если вы хотите увидеть, насколько он действительно хорош, Google DeepMind поделилась несколькими примерами видео с диалогами персонажей в этом посте в X:

Глядя на примеры видеороликов, я думаю, что мы уже наблюдаем следующее поколение ИИ-кинопроизводства.

Добавлю от себя, что Veo 3 теперь доступна в Телеграм. Я уже опробовал новую модель в этом боте - пока единственном, в который добавили эту модель.

Мы вступаем в эпоху ИИ-кинопроизводства 2.0

Прошли те времена, когда вам приходилось генерировать видео на одной платформе, например Kling, писать сценарий с помощью ChatGPT, отправлять его в другой инструмент для работы со звуком, например ElevenLabs, а затем запускать отдельную ИИ-модель, чтобы синхронизировать губы с голосом.

Это был сложный рабочий процесс, который мог занять несколько часов, а то и дней. И это еще не считая стоимости использования пяти различных инструментов и подписок.

В Veo 3 все это объединено в единый конвейер. Один промпт. Один инструмент. И каким-то образом он объединяет все вместе - визуально и на слух.

Возьмем, к примеру, эту сцену:

Промпт: A medium shot frames an old sailor, his knitted blue sailor hat casting a shadow over his eyes, a thick grey beard obscuring his chin. He holds his pipe in one hand, gesturing with it towards the churning, grey sea beyond the ship’s railing. “This ocean, it’s a force, a wild, untamed might. And she commands your awe, with every breaking light”

Только посмотрите, как кинематографична эта сцена, как выразителен персонаж и как хорошо двигаются его губы. Такое ощущение, что вы смотрите, как настоящий актер произносит реплику.

Понимание физического мира также невероятно хорошо. Посмотрите, как этот бумажный кораблик плывет по воде и падает в дренаж.

A paper boat sets sail in a rain-filled gutter. It navigates the current with unexpected grace. It voyages into a storm drain, continuing its journey to unknown waters.

Мне трудно понять, что все это сгенерировано искусственным интеллектом. Никаких инструментов для цифрового моделирования, никаких часов рендеринга и никаких 3D-художников.

В этот момент трудно не представить себе общую картину. Мы приближаемся к миру, в котором целые анимационные короткометражные фильмы или даже полнометражные картины можно будет создавать, просто написав промпт. Не сотни часов работы в Blender или AutoCAD. Не команда художников. Только идея и подходящий инструмент.

На Google IO был показан пример сгенерированной ИИ сцены разговора совы и скунса.

Представляете, как мы близки к тому, чтобы, написав всего один промпт, создать целый фильм? Это немного пугает, но в то же время невероятно захватывает.

Будущее кинопроизводства с помощью ИИ

Google добавила в Veo 3 функции, которые действительно делают его подходящим для реальных съемок. Некоторые из новых возможностей, созданных для кинематографистов, включают:

Использование «ингредиентов», предоставленных режиссером (персонажи, сцены или стили), и сохранение их согласованности на протяжении всего видео.
Режиссеры могут управлять Veo с помощью точных инструкций для камеры и вести съемку по определенной схеме.
Эти возможности помогают режиссерам свободно выражать свои идеи с помощью Veo.

Компания Google объединила усилия с режиссером Дарреном Аронофски и кинематографистом Элизой Макнитт, а также с их новыми предприятиями по созданию историй «Primordial Soup» и «Ancestra», чтобы сформировать возможности Veo для удовлетворения потребностей авторов.

Google представила ИИ-генератор видео Veo 3

«Это история, которая охватывает всю историю Вселенной. Но на самом деле это история о маме и о том, что происходит, когда ее ребенок рождается с дырой в сердце. Мы сняли очень эмоциональные спектакли, а затем создали видео, которое никогда не смогли бы снять иначе». - Элиза МакНитт

Она сочетает живое исполнение с видео, сгенерированным Veo, например, микроскопическими мирами и космическими событиями, что позволяет ей придать кинематографический масштаб и эмоции глубоко личной истории.

ИИ в наши дни развивается очень быстро.

Генеративные медиа расширяют границы творчества. Google тесно сотрудничает с творческим сообществом, чтобы создать технологию, способствующую творческому процессу.

Это касается не только кинематографа.

Jellyfish, известная компания в области цифрового маркетинга, входящая в состав The Brandtech Group, интегрировала Veo в свою высокоэффективную маркетинговую ИИ-платформу Pencil и объединила усилия с Japan Airlines, чтобы предложить генерируемые ИИ развлечения на борту самолета.

Вот пример видеорекламы, созданной с помощью Veo 3:

Вот что сказал Дэвид Джонс, генеральный директор Brandtech:

«Благодаря такому изменению контроля и качества ранее невозможные идеи превращаются в реальный маркетинговый контент за считанные минуты».

По его словам, кампании, созданные с помощью Veo, сократили затраты на производство на 50% и значительно сократили сроки изготовления. Это не просто незначительное улучшение - это перестройка целой отрасли.

Я не удивлюсь, если в скором времени на эту технологию перейдут и другие бренды.

Новый инструмент для создания фильмов с использованием искусственного интеллекта

Наряду с Veo 3 компания Google также запустила инструмент под названием Flow. Он помогает создавать кинематографические клипы, плавно переводить их в сцены и обеспечивать достаточную согласованность, чтобы рассказать историю.

Flow - это инструмент для создания кинематографических роликов, разработанный специально для самых продвинутых моделей Google Deepmind - Veo, Imagen и Gemini.

Вы можете генерировать видеоклипы различными способами:

Text to Video. Создание с помощью текстового промпта
Frames to Video. Загрузите или сгенерируйте изображения для использования в качестве начальных и/или конечных кадров
Ingredients to Video. Загрузите или создайте изображения для использования в качестве предметных или стилевых референсов

Вот список всех возможностей Flow:

Я изучу Flow и напишу обзор с примерами в отдельном посте. Пока же вы можете изучить некоторые часто задаваемые вопросы здесь. Вы также можете посмотреть здесь некоторые из лучших ИИ-фильмов, созданных с помощью Flow.

Flow TV

labs.google

Как получить доступ к Veo 3

Есть несколько способов попробовать Veo 3 прямо сейчас:

Теперь он доступен в Google AI Studio. Просто откройте вкладку Generate Media и выберите Veo 3, чтобы начать создавать видео.
Он также доступен через новый ИИ-инструмент Google для создания фильмов - Flow. Обратите внимание, что для его использования требуется подписка на Google AI.
Veo 3 находится в закрытом режиме предварительного просмотра на Vertex AI и станет более доступным в ближайшие недели.

А вот для разработчиков публичного API пока нет. Google говорит, что он появится в Vertex AI в «ближайшие несколько недель», но мы уже слышали об этом раньше. Я надеюсь, что такие сервисы, как Fal AI или Replicate, тоже получат доступ.

На данный момент Veo 3 доступен только в США и только если вы являетесь пользователем тарифного плана Google AI Ultra.

Вот подробная информация о ценах и о том, что входит в каждую подписку:

И да... Google AI Ultra стоит 250 долларов в месяц.

После просмотра всех анонсов на Google IO 2025 я был просто потрясен. Google только что доказала, что лидирует в гонке ИИ. Veo 3 - это не просто небольшое обновление по сравнению с Veo 2. Звук и диалоговые функции - это очень важно. Они могут многое изменить в мире ИИ-кино и рекламы.

Также они представили новый инструмент под названием Flow, с помощью которого можно создавать полноценные сцены и сохранять согласованность действий. Это очень полезно, если вы пытаетесь рассказать историю или создать что-то с четким направлением.

На данный момент я считаю, что Veo 3 опережает другие видеогенераторы, такие как Runway, Kling и Hunyuan. Качество лучше, промпты работают точнее, и в нем больше функций. Но, зная Google, цены и ограничения на результаты могут стать решающим фактором... Посмотрим, когда он будет полностью развернут во всем мире.

Выбранные примеры видеороликов выглядят великолепно, но я жду, когда смогу попробовать Veo 3, прежде чем делать какие-либо предположения или преждевременно высказывать свои мысли. На данный момент, к сожалению, он доступен только для пользователей из США и требует подписки на Google AI Ultra. Ценник в 250 долларов в месяц очень высокий для обычных пользователей вроде меня.

Я жду, когда появится API, чтобы протестировать его и, возможно, использовать в своих веб-приложениях.

В любом случае, что вы думаете о Veo 3? Напишите об этом в комментариях.

Друзья, буду рад, если вы подпишетесь на мой телеграм-канал про нейросети, чтобы не пропускать анонсы статей, и на канал с гайдами и советами по работе с нейросетями - я стараюсь делиться только полезной информацией.

Хабы: