
Если Veo 2 произвел на вас впечатление, то Veo 3 вас просто поразит.
Google IO 2025 завершилась, и это была абсолютная масса анонсов в сфере ИИ. Многие люди, включая меня, до сих пор поднимают челюсти с пола. Но из всех анонсов Veo 3 - один из самых захватывающих для меня.
Об остальных анонсах я расскажу в отдельном посте, а пока давайте сосредоточимся на новейшей генеративной видеомодели Google.
Что нового в Veo 3
Вот краткий обзор основных обновлений:
Улучшено качество и физический рендеринг при генерации видео по текстовым и графическим промптам
Большее разрешение при выводе в 4K
Улучшенное соблюдение промптов, что означает более точные ответы на ваши инструкции
Автоматическое добавление речи, например, диалогов и закадрового голоса.
Встроенная функция генерации звука, например музыки и звуковых эффектов.
Да, Veo 3 теперь может автоматически добавлять диалоги. Для меня это самая потрясающая функция из всех. Вероятно, она стала возможной благодаря работе DeepMind над созданием искусственного интеллекта для преобразования видео в аудио, о которой было объявлено в июне прошлого года.
Если вы хотите увидеть, насколько он действительно хорош, Google DeepMind поделилась несколькими примерами видео с диалогами персонажей в этом посте в X:
Глядя на примеры видеороликов, я думаю, что мы уже наблюдаем следующее поколение ИИ-кинопроизводства.
Мы вступаем в эпоху ИИ-кинопроизводства 2.0
Прошли те времена, когда вам приходилось генерировать видео на одной платформе, например Kling, писать сценарий с помощью ChatGPT, отправлять его в другой инструмент для работы со звуком, например ElevenLabs, а затем запускать отдельную ИИ-модель, чтобы синхронизировать губы с голосом.
Это был сложный рабочий процесс, который мог занять несколько часов, а то и дней. И это еще не считая стоимости использования пяти различных инструментов и подписок.
В Veo 3 все это объединено в единый конвейер. Один промпт. Один инструмент. И каким-то образом он объединяет все вместе - визуально и на слух.
Возьмем, к примеру, эту сцену:
Промпт: A medium shot frames an old sailor, his knitted blue sailor hat casting a shadow over his eyes, a thick grey beard obscuring his chin. He holds his pipe in one hand, gesturing with it towards the churning, grey sea beyond the ship’s railing. “This ocean, it’s a force, a wild, untamed might. And she commands your awe, with every breaking light”
Только посмотрите, как кинематографична эта сцена, как выразителен персонаж и как хорошо двигаются его губы. Такое ощущение, что вы смотрите, как настоящий актер произносит реплику.
Понимание физического мира также невероятно хорошо. Посмотрите, как этот бумажный кораблик плывет по воде и падает в дренаж.
A paper boat sets sail in a rain-filled gutter. It navigates the current with unexpected grace. It voyages into a storm drain, continuing its journey to unknown waters.
Мне трудно понять, что все это сгенерировано искусственным интеллектом. Никаких инструментов для цифрового моделирования, никаких часов рендеринга и никаких 3D-художников.
В этот момент трудно не представить себе общую картину. Мы приближаемся к миру, в котором целые анимационные короткометражные фильмы или даже полнометражные картины можно будет создавать, просто написав промпт. Не сотни часов работы в Blender или AutoCAD. Не команда художников. Только идея и подходящий инструмент.
На Google IO был показан пример сгенерированной ИИ сцены разговора совы и скунса.
Представляете, как мы близки к тому, чтобы, написав всего один промпт, создать целый фильм? Это немного пугает, но в то же время невероятно захватывает.
Будущее кинопроизводства с помощью ИИ
Google добавила в Veo 3 функции, которые действительно делают его подходящим для реальных съемок. Некоторые из новых возможностей, созданных для кинематографистов, включают:
Использование «ингредиентов», предоставленных режиссером (персонажи, сцены или стили), и сохранение их согласованности на протяжении всего видео.
Режиссеры могут управлять Veo с помощью точных инструкций для камеры и вести съемку по определенной схеме.
Эти возможности помогают режиссерам свободно выражать свои идеи с помощью Veo.
Компания Google объединила усилия с режиссером Дарреном Аронофски и кинематографистом Элизой Макнитт, а также с их новыми предприятиями по созданию историй «Primordial Soup» и «Ancestra», чтобы сформировать возможности Veo для удовлетворения потребностей авторов.

«Это история, которая охватывает всю историю Вселенной. Но на самом деле это история о маме и о том, что происходит, когда ее ребенок рождается с дырой в сердце. Мы сняли очень эмоциональные спектакли, а затем создали видео, которое никогда не смогли бы снять иначе». - Элиза МакНитт
Она сочетает живое исполнение с видео, сгенерированным Veo, например, микроскопическими мирами и космическими событиями, что позволяет ей придать кинематографический масштаб и эмоции глубоко личной истории.
ИИ в наши дни развивается очень быстро.
Генеративные медиа расширяют границы творчества. Google тесно сотрудничает с творческим сообществом, чтобы создать технологию, способствующую творческому процессу.
Это касается не только кинематографа.
Jellyfish, известная компания в области цифрового маркетинга, входящая в состав The Brandtech Group, интегрировала Veo в свою высокоэффективную маркетинговую ИИ-платформу Pencil и объединила усилия с Japan Airlines, чтобы предложить генерируемые ИИ развлечения на борту самолета.
Вот пример видеорекламы, созданной с помощью Veo 3:
Вот что сказал Дэвид Джонс, генеральный директор Brandtech:
«Благодаря такому изменению контроля и качества ранее невозможные идеи превращаются в реальный маркетинговый контент за считанные минуты».
По его словам, кампании, созданные с помощью Veo, сократили затраты на производство на 50% и значительно сократили сроки изготовления. Это не просто незначительное улучшение - это перестройка целой отрасли.
Я не удивлюсь, если в скором времени на эту технологию перейдут и другие бренды.
Новый инструмент для создания фильмов с использованием искусственного интеллекта
Наряду с Veo 3 компания Google также запустила инструмент под названием Flow. Он помогает создавать кинематографические клипы, плавно переводить их в сцены и обеспечивать достаточную согласованность, чтобы рассказать историю.
Flow - это инструмент для создания кинематографических роликов, разработанный специально для самых продвинутых моделей Google Deepmind - Veo, Imagen и Gemini.
Вы можете генерировать видеоклипы различными способами:
Text to Video. Создание с помощью текстового промпта
Frames to Video. Загрузите или сгенерируйте изображения для использования в качестве начальных и/или конечных кадров
Ingredients to Video. Загрузите или создайте изображения для использования в качестве предметных или стилевых референсов

Вот список всех возможностей Flow:

Я изучу Flow и напишу обзор с примерами в отдельном посте. Пока же вы можете изучить некоторые часто задаваемые вопросы здесь. Вы также можете посмотреть здесь некоторые из лучших ИИ-фильмов, созданных с помощью Flow.
Как получить доступ к Veo 3
Есть несколько способов попробовать Veo 3 прямо сейчас:
Теперь он доступен в Google AI Studio. Просто откройте вкладку Generate Media и выберите Veo 3, чтобы начать создавать видео.
Он также доступен через новый ИИ-инструмент Google для создания фильмов - Flow. Обратите внимание, что для его использования требуется подписка на Google AI.
Veo 3 находится в закрытом режиме предварительного просмотра на Vertex AI и станет более доступным в ближайшие недели.
А вот для разработчиков публичного API пока нет. Google говорит, что он появится в Vertex AI в «ближайшие несколько недель», но мы уже слышали об этом раньше. Я надеюсь, что такие сервисы, как Fal AI или Replicate, тоже получат доступ.
На данный момент Veo 3 доступен только в США и только если вы являетесь пользователем тарифного плана Google AI Ultra.
Вот подробная информация о ценах и о том, что входит в каждую подписку:

И да... Google AI Ultra стоит 250 долларов в месяц.
После просмотра всех анонсов на Google IO 2025 я был просто потрясен. Google только что доказала, что лидирует в гонке ИИ. Veo 3 - это не просто небольшое обновление по сравнению с Veo 2. Звук и диалоговые функции - это очень важно. Они могут многое изменить в мире ИИ-кино и рекламы.
Также они представили новый инструмент под названием Flow, с помощью которого можно создавать полноценные сцены и сохранять согласованность действий. Это очень полезно, если вы пытаетесь рассказать историю или создать что-то с четким направлением.
На данный момент я считаю, что Veo 3 опережает другие видеогенераторы, такие как Runway, Kling и Hunyuan. Качество лучше, промпты работают точнее, и в нем больше функций. Но, зная Google, цены и ограничения на результаты могут стать решающим фактором... Посмотрим, когда он будет полностью развернут во всем мире.
Выбранные примеры видеороликов выглядят великолепно, но я жду, когда смогу попробовать Veo 3, прежде чем делать какие-либо предположения или преждевременно высказывать свои мысли. На данный момент, к сожалению, он доступен только для пользователей из США и требует подписки на Google AI Ultra. Ценник в 250 долларов в месяц очень высокий для обычных пользователей вроде меня.
Я жду, когда появится API, чтобы протестировать его и, возможно, использовать в своих веб-приложениях.
В любом случае, что вы думаете о Veo 3? Напишите об этом в комментариях.
Друзья, буду рад, если вы подпишетесь на мой телеграм-канал про нейросети, чтобы не пропускать анонсы статей, и на канал с гайдами и советами по работе с нейросетями - я стараюсь делиться только полезной информацией.