Обновить
256K+

Работа с видео *

Все о создании и обработке видео

62,62
Рейтинг
Сначала показывать
Порог рейтинга

Представлен полный курс по Sora 2 от OpenAI, включая официальный гайд по промптам и созданию сцен с помощью нейросети: аниме, документалки, интервью с любыми персонажами, настройка камеры, света и генерация осмысленных диалогов.

Чем короче промпты — тем больше свободы у нейронки. Так вы дадите ИИ творческую свободу. Пример: In a 90s documentary-style interview, an old Swedish man sits in a study and says, "I still remember when I was young."

Настраиваем формат видео.

  • Format & Look: Duration 4s

  • 180° shutter; digital capture emulating 65 mm photochemical contrast; fine grain; subtle halation on speculars; no gate weave.

Выставляем свет и создаём атмосферу:

  • Lighting & Atmosphere

  • Natural sunlight from camera left, low angle (07:30 AM).

  • Bounce: 4×4 ultrabounce silver from trackside.

  • Negative fill from opposite wall.

  • Practical: sodium platform lights on dim fade.

  • Atmos: gentle mist; train exhaust drift through light beam.

«Подбираем» камеру для съёмки. Увеличиваем или уменьшаем фокус, корректируем передний и задний планы:

  • Camera shot: wide shot, low angle

  • Depth of field: shallow (sharp on subject, blurred background)

  • Lighting + palette: warm backlight with soft rim

Ведём себя как настоящий режиссёр и контролируем, задаём игру актёров: Actor takes four steps to the window, pauses, and pulls the curtain in the final second.

[Описание сцены прозой простым языком. Опиши персонажей, костюмы, декорации, погоду и другие детали. Будь как можно более описательным, чтобы видео соответствовало твоему замыслу.]
Кинематография:
Кадр камеры: [композиция и угол съёмки, например: широкий план, уровень глаз]
Настроение: [общий тон, например: кинематографично и напряжённо, игриво и тревожно, роскошное ожидание]
Действия:
- [Действие 1: чёткое, конкретное движение или жест]
- [Действие 2: ещё один отдельный момент в клипе]
- [Действие 3: другое действие или реплика]
Диалоги:
[Если в кадре есть диалог, добавь короткие естественные реплики здесь или в списке действий. Делай их короткими, чтобы они уместились в длину клипа.]

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

С момента релиза Sora 2 прошло 4 дня. Это и модель генерации видео от OpenAI, и приложение – конкурент для TikTok. Разница лишь в том, что в Sora все клипы сгенерированы искусственным интеллектом.

На самом деле смотреть в Sora не на что. Такое впечатление возникло лично у меня, когда я вчера наконец-то сподобился попросить код инвайта у сетевых знакомых. Рекомендации Sora забиты максимально однотипными трендами: сначала кто-то придумывает удачный промпт с интересно выглядящим результатом, а потом остальные подхватывают идею и заменяют персонажей на других.

К примеру, кто-то нащупал промпт для генерации клипов с нательного полицейского видеорегистратора в ситуации, где коп тормознул необычного водителя. Теперь на место автонарушителя подставляют абсолютно любых персонажей: лабрадора, голубого пришельца или даже персонажа анимэ. Казалось бы, можно каждый раз описывать абсолютно разную ситуацию, но создатели либо нажимают на кнопку Remix, либо заменяют в промпте всего одно слово. И каждый раз там будут всё те же Пикачу и Сэм Альтман.

Но это не просто лень, часто этой повторяемости есть объективные причины. Механизмы безопасности в генерации отказывают часто, поэтому легче полагаться на уже исследованный сообществом репертуар. Границы дозволенного понятны: мёртвых можно, живых трогать нельзя. Сервис Sora 2 не будет генерировать Дональда Трампа или живых знаменитостей, но согласится вставить в видео Баха, Хокинга или Майкла Джексона.

А вот персонажей Sora 2 рисует почти любых. С одной стороны, некоторых из них чисто физически нельзя закопирайтить. Если попросить выступление Иисуса на TED, будет именно тот общий образ европеоидного богочеловека, который распространён в американской массовой культуре, а не попытки задуматься о реконструкции облика исторической личности из Передней Азии эпохи античности.

Но вообще-то границ авторских прав будто и не существует. Sora кишит 10-секундными клипами с покемонами, Спанч Бобом, Риком и Морти. Иногда бывают герои игрового кино, например Тони Монтана. Или случается, что тот же коп тормознул DMC Дока Брауна и Марти Макфлая.

Важно также, что модель отлично знает голоса. При генерации аудиодорожки Sora 2 может корректно воссоздать голос Боба Росса и даже знает, как звучит Хацунэ Мику. Обычный голос (не пение) Майкла Джексона звучит похоже на его мягкий и тонкий голосок, разительно отличающийся от сценического высокого тенора.

Кстати, в датасетах обучения модели явно не было артефактов советской культуры. Союзмультфильмовский Винни-Пух не будет говорить ускоренным на магнитофоне голосом Евгения Леонова. Sora 2 даже приблизительно не знает, как выглядит планета Плюк. Если он не умеет себя развлекать самостоятельно, россиянину в приложении Sora будет откровенно скучно.

Итак, этот праздник непослушания и тотального нарушения копирайта длится уже пятые сутки, но только сегодня Интернет внезапно спохватился. Как указал бывший инженер Twitch и ныне глава Ping.gg Тео Браун, правообладатели иногда умудряются удалять результаты сгенерированного на Sora 2. Хотя казалось бы — закопирайтить результаты труда ИИ невозможно.

Другие наблюдения откровенно пугают. DHuskyTron заметил, что один из результатов генерации в Sora 2 полностью совпадает с реальным кадром из «Рика и Морти».

Возможно, с Adult Swim были заключены особые соглашения, но это именно не перерисовка, это полная копия кадра.

Могу также отметить, что Sora 2 годится разве что для производства слопа, этого типичного смешного ИИ-шлака, который быстро наскучивает из-за своей однообразности. Сколько ни бейся над промптом, модель не может составить тысячелетний таймлапс Москвы; зато в Комсомол пилотов Евангелионов у меня без проблем взяли.

Теги:
Всего голосов 8: ↑4 и ↓40
Комментарии2

Приложение Sora 2 доступно пока по приглашениям и работает только на устройствах Apple, но видеороликами из него забиты уже все ленты социальных сетей. Хотя это просто очередной генератор видео, OpenAI позиционирует приложение как соперника TikTok в деле разжижения мозгов и уничтожения способности удерживать внимание. Разница лишь в том, что контент создаёт генеративная нейросеть на основе промптов пользователей. Бесполезно проводить время предлагается за просмотром шлака от ИИ.

Заявляется, что относительно первой версии модель Sora 2 значительно более продвинутая. Это очевидно даже по описанию технических характеристик: Sora 2 генерирует 10-секундные клипы с синхронизированной аудиодорожкой, в то время как первая итерация модели умела создавать только видеоряд. Клипы могут быть ремиксом или начинаться со статичного изображения, а особую популярность снискала функция камео.

На практике это означает, что все ленты сейчас заполнены Сэмом Альтманом, ворующим игровые видеокарты из магазинов электроники. Ну а чего вы хотели? Фантазии у первопроходцев мало, да и его лицо в редакторе — это одно из предлагаемых. В лучшем случае он будет ползать по полу офиса OpenAI в кигуруми кота и истошно мяукать.

На самом деле интересные бенчмарки всё же придумывают. К примеру, как показывает Кристофер Фрайант, Sora 2 выдаёт отлично выглядящие 10-секундные клипы геймплея любой популярной видеоигры. Многие хвалят Sora 2 за отличное понимание физики.

Как утверждает дата-саентист из Meta¹ Колин Фрейзер, не всё так однозначно. У себя в микроблоге он показал несколько примеров откровенных косяков Sora 2. Ниже представлена склейка шести из них.

Здесь опробованы разные промпты. Чаще всего они связаны с отделением одного объекта от другого или их совмещением в единое целое. Как показал скептик, с взаимодействием объектов в кадре у Sora 2 откровенно туго:

  1. Вылезающий из автомобиля человек. В ответ на промпт Фрейзера модель зажимает ногу человека дверью.

  2. Прыгающий через обруч пёс никуда не прыгает.

  3. Пиво ведёт себя как желе, у бармена с пальцами случилась каляка-маляка.

  4. Кстати, попытки упростить промпт про вылезание из машины ничего хорошего не приносят.

  5. Даже когда Колин явно задал в промпте состояние стакана, сосуд с апельсиновым соком опустошён до дна не был — уровень жидкости даже не изменился.

  6. Ну и задувание свечей всё так же на реальность не походит.

Твиты Фрейзера вызвали резко негативную реакцию. У себя в микроблоге он пожаловался, что люди в ответ на поиск изъянов начинают злиться. Колин не понимает, почему многие настолько эмоционально инвестированы в какое-то приложение для генерации и листания видеороликов.

(1) Холдинговая компания Meta — экстремистская организация, её деятельность запрещена.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

OpenAI представила Sora 2 с синхронизированным аудио и системой персонализированных камео

OpenAI выпустила вторую версию модели генерации видео Sora с поддержкой высококачественного аудио и функцией Cameo для создания персонализированных аватаров. Модель доступна через новое iOS-приложение с социальными функциями для США и Канады.

Технические характеристики

Команда OpenAI позиционирует Sora 2 как "GPT-3.5 момент" для генеративного видео — переход от proof-of-concept к практически применимой технологии. Модель генерирует видео с разрешением 720p при 30 FPS длительностью 5-10 секунд.

Ключевые возможности:

  • Синхронизированная генерация видео и аудио

  • Улучшенная симуляция физических процессов

  • Поддержка мультисценарных инструкций

  • Различные визуальные стили от фотореализма до анимации

Система Cameo

Функция Cameo позволяет создавать персонализированные аватары на основе однократной записи голоса и внешности. Система переносит внешний вид и голос в любые сгенерированные сцены.

Контроль безопасности:

  • Только авторизованные пользователи могут использовать ваш камео

  • Полная видимость всех видео с вашим образом

  • Возможность отзыва доступа в любой момент

  • Усиленные ограничения для несовершеннолетних

  • Блокировка дипфейков публичных персон без согласия

Симуляция физики

Основной прорыв касается моделирования сложных физических процессов. Модель корректно обрабатывает гимнастические трюки, отскок баскетбольного мяча, плавучесть при акробатике. Ранние модели демонстрировали артефакты при движении объектов — Sora 2 показывает существенное улучшение.

iOS-приложение

Параллельно запущено iOS-приложение с функциями социальной сети для создания видео, ремикса контента и просмотра персонализированной ленты ИИ-видео.

Возможности:

  • Создание видео из текстовых промптов

  • Ремикс существующего контента

  • Персонализированная лента на основе взаимодействий

  • Рекомендации через языковые модели OpenAI

OpenAI заявляет, что не оптимизирует приложение для максимизации времени в ленте, а фокусируется на стимулировании создания контента.

Доступность и монетизация

Приложение запускается по инвайтам в США и Канаде. Изначально Sora 2 будет бесплатной с "щедрыми лимитами". Pro-версия на sora.com стоит $200/месяц и обеспечивает доступ к расширенным возможностям. API в разработке для корпоративных клиентов.

Сравнение с конкурентами

Позиционирование:

  • Google Veo 3 — 1080p, снижение цен на 50%

  • Runway Gen-3 — профессиональный видеопродакшн

  • Pika — эффекты и анимация

  • Sora 2 — социальный подход с персонализацией

Ограничения

Текущая версия ограничена разрешением 720p и длительностью 5-10 секунд. Качество симуляции физики улучшено, но может демонстрировать артефакты в сложных сценах с множественными взаимодействующими объектами.

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии0

Apple выпустила видео с режиссёром Дэнни Бойлом, который рассказал об особенностях съёмки фильма «28 лет спустя» на iPhone. Некоторые сцены фильма снимались одновременно сразу на 20 iPhone. Смартфоны по дуге были закреплены на специальной установке, которую несли несколько сотрудников съёмочной площадки.

Бойл пояснил, что использование iPhone дало «возможность работать в удалённых местах, очень быстро и легко, не оставляя заметного следа».

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Сжимаем видое без потери качества — релизнулся топовый компрессор SqueezeVid:

  • Сжимает видео, не теряя ни единого пикселя — качество останется на высочайшем уровне.

  • Работает со всеми популярными форматами, включая MP4, MOV и AVI.

  • Можно конвертировать ролик в нужный формат и даже контролировать степень сжатия.

  • Вся обработка происходит локально, прямо на ПК пользователя

  • Без ограничений, без регистрации, бесплатно.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Apple выпустила тактильный трейлер фильма F1, улучшенный с помощью вибраций iPhone.

Если у вас iPhone под управлением iOS 18.4 или более поздней версии, на вкладке Apple TV Plus приложения TV теперь есть трейлер предстоящего фильма Брэда Питта F1, который теперь улучшен с помощью вибраций, создаваемых современным компонентом Taptic Engine в iPhone.

Пользователи могут не только почувствовать обороты двигателя болида F1, но и более тонкие события в трейлере, такие как щелчок ремня безопасности и нажатие кнопок на рулевом колесе.

Теги:
Всего голосов 2: ↑2 и ↓0+5
Комментарии0

Релизнулся бесплатный и без регистрации загрузчик видео с Youtube — Cliply, который может скачать любой ролик в высоком качестве, любые отрезки и клипы по нужным таймингам.

Теги:
Всего голосов 5: ↑5 и ↓0+7
Комментарии2

Некто Broksh опубликовал видеоролик, где пенсионерка демонстрирует необычного домашнего питомца. В типичной пятиэтажке старушка содержит гиппопотама. Понятно, что это ещё одна демонстрация недавно вышедшей модели генерации видео со звуком Google Veo 3.

Нелегко оценить конкретные человеческие усилия, приложенные для создания этого видеоролика. Broksh — это не человек, а целый продакшн полного цикла с опытом работы в съёмках реалити-шоу, клипов, рекламы и коротких фильмов. Если судить по шоурилам студии (1, 2), навыков вполне хватает на сложную композицию, VFX, CGI и прочий постпродакшн. Вполне возможно, что творчество генеративных моделей Veo 3 или Sora было сильно доработано человеческими руками.

В комментариях автор видеоролика признаётся, что пришлось правильно составить промпты для модели, расставить кадры, прописать текст и интонации несуществующих актёров. Также указывается, что были дополнительно доработаны звук, цветокоррекция и постпродакшн в целом.

Бегемот Булька легко оттягивает на себя всё внимание зрителя, но огрехи работы ИИ всё равно заметны. Внимательный глаз зацепится за то, что старушка меняется от сцены к сцене: то она чуть выше, то её лицо становится другим. В одном случае хозяйка нарушает правила геометрии и достаёт из холодильника нереалистично огромный пластиковый таз, набитый игрушками Labubu — «трендами» для питомца. При этом таз издаёт совсем не похожий на пластик звук. Также по показанному нет никакой возможности хоть как-то оценить геометрию квартиры. Выглядит даже так, будто в квартире две кухни.

Иногда угадываются промпты, всем требованиям которых ИИ пытался удовлетворить. В одном из кадров бабулька едет в магазин, оседлав гиппопотама. При этом заметны сразу два одноэтажных здания магазинов и излишне близко стоящие, в нарушение любых строительных норм, жилые многоквартирные дома. Очевидно, что в реальной жизни значительную площадь крупного двора между домами занимала бы детская площадка, а продуктовые магазины так близко не встречаются и часто располагаются на первых этажах жилых домов.

Наконец, в средней полосе подсолнухи начинают цвести в лучшем случае в конце июня, а вот у героини клипа они украшают подоконник кухни, из окна которого почему-то видны сугробы. В некоторых сценах обычно изображено подобие начала мая с его голыми ветвями деревьев и едва проросшей травой, хотя иногда листва уже есть.

Теги:
Всего голосов 3: ↑2 и ↓1+1
Комментарии8

Microsoft признала, что задействовала ИИ в рекламе Surface Pro и Surface Laptop для создания кадров в которых было мало движения. В ролике специально сделана быстрая смена кадров, чтобы зрители не успевали всматриваться в детали.

Крупные планы рук, печатающих на клавиатуре, и другие сцены, где были сложные движения, были сняты на настоящую камеру. Microsoft пошла на этот шаг, поскольку в таких кадрах искусственный интеллект показывал плохие результаты.

Для создания видео специалисты из Microsoft сначала сгенерировали изображения при помощи текстовых подсказок и визуальных референсов. Затем полученные картинки были загружены в видеогенераторы Hailuo и Kling. Какие именно генераторы использовались для создания изображений, в компании не уточнили.

Теги:
Рейтинг0
Комментарии4

🖥 Google дропнул свой топовый видеогенератор Veo 2 для всех — создавать кинематографичные ролики можно в AI Studio.

Лимит: 3-5 видосов в день, зато БЕСПЛАТНО. Если у вас ещё не появился доступ, попробуйте притвориться американцем с помощью VPN.

Кстати, вчера Google дропнул Gemini 2.5 Flash !

Теги:
Всего голосов 3: ↑2 и ↓1+1
Комментарии1

Группа OK Go использовала 29 роботов и более 60 зеркал для съемок своего нового музыкального клипа на песню под названием Love, в котором использованы калейдоскопические эффекты. Снимали клип в течение двух дней на заброшенном железнодорожном вокзале Будапешта. Всего было сделано 39 дублей, а сорежиссером выступил Дамиан Кулаш из OK Go, который также написал песню.

Теги:
Рейтинг0
Комментарии1

Ближайшие события

Премия «Оскар» в 2025 году за лучший анимационный полнометражный фильм присуждена анимационному фильму «Поток» (Flow), снятому латвийским режиссёром Гинтсом Зилбалодисом. Мультфильм повествует о приключениях кота во время потопа и примечателен тем, что создан независимой командой с ограниченным бюджетом в свободной системе 3D‑моделирования Blender. Работа над фильмом продолжалась пять с половиной лет.

Благодаря компьютерному мультфильму «Поток» во всём мире люди стали чаще брать чёрных котов из приютов — раньше из‑за суеверий и предрассудков многие котики с такой расцветкой не могли найти свой дом.

Крупнейшая зоозащитная организация в Бразилии Ampara Animal заявила, что мультфильм оказал положительное влияние на то, как люди относятся к чёрным котам.

Не все понимают, насколько сильно этот фильм меняет ситуацию: теперь чёрных котов стали чаще забирать из приютов, тогда как раньше их долго не разбирали из‑за суеверий.

зоозащитная организация Ampara Animal.

Теги:
Всего голосов 3: ↑3 и ↓0+6
Комментарии3

Исследовал интернет и наткнулся на GitHub Unwrapped. Он на основе активности в GitHub создаёт видео, где можно увидеть часто используемые языки, часы спонтанной работы, звёзды и всё остальное. Достаточно ввести только имя профиля, чтобы получить видео. Код открыт.

Сделано с использованием Remotion — тоже с открытым кодом, которая позволяет автоматизировать создание видео на React в веб. Документация хорошая, но надо разбираться. Увидел это и решил, что круто, надо поделиться!

P.S. Моя активность в этом ролике, если кому-то будет интересно.

Теги:
Всего голосов 4: ↑3 и ↓1+3
Комментарии0

ИИ меняет YouTube. Новые фичи

Youtube выкатил массу изменений, я собрал те, которые относятся к ИИ, и саммаризовал их.

Зачем нам это знать? Youtube фиксирует тренд, что именно из разработок с ИИ находит применение в жизни, и куда скорее всего пойдут остальные в этой индустрии.

Вот самые интересные фичи, представленные на недавнем мероприятии Made on YouTube:

  1. Вкладка "Вдохновение" в YouTube Studio: Теперь ИИ может предложить идеи для видео, включая заголовки, описания и даже сценарии. Это значительно упрощает работу, особенно если вы ищете вдохновение или оптимизацию под алгоритмы YouTube.

  2. DeepMind и YouTube Shorts: Интеграция ИИ-модели Veo от Google DeepMind позволит автоматически создавать фоны для коротких роликов. Функция Dream Screen сделает видео более динамичными, а авторы могут использовать её для создания шестисекундных роликов с помощью ИИ. Контент будет помечен специальными водяными знаками, чтобы зрители знали, что использовался ИИ.

  3. ИИ-ассистент для общения с аудиторией: С помощью ИИ авторы смогут быстрее отвечать на комментарии, используя готовые реплики, адаптированные под их стиль. Это сократит время на общение, сохранив личный подход.

  4. Автоматическое дублирование: Теперь ваши видео могут быть автоматически переведены на разные языки, что поможет расширить аудиторию и взаимодействие с пользователями по всему миру.

Отличный тренд, как думаете?

В сборе инфы помог бесплатный телеграм-бот.
Мой канал в телеге lanchev_pro_ai.

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии2

Вопрос к Хабражителям: вы никогда не встречали DVD-проигрывателей (портативных или стационарных) на Linux, причем с относительно доступным юзерспейсом? Есть, конечно, проигрывали Samsung, но там секьюрбут и линукс огорожен

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Telegram-боты для работы (маркетологам, авторам и не только)

Собираю ботов, которые пригодятся в работе с текстами, картинками и др.

Контент и постинг:

  • PosterBot — собирает посты из других соц. сетей и публикует в TG.

  • Meming Bot — быстро оформляет мемы.

  • Watermark Bot — добавляет вотермарку.

  • Скриншот переписки — делает фейковый скриншот диалога в TG.

  • GiveMeNews — собирает новости из разных источников по ключевым словам.

  • OrfoBot — проверяет текст на наличие орфографических ошибок.

  • Fixmebot — исправляет ошибки в тексте на английском языке.

  • Переводчик с тарабарщины — транслитерирует текст, если использовали неверную раскладку.

  • Imager — делает скриншот веб-страницы.

  • Video to Gif Converter — создает гифки из видео.

  • GIF Search — ищет гифки.

  • Бот Геннадий — подбирает хештеги.

Скачивание и сохранение видео и картинок:

Работа с блогерами в TG:

  • Berezhok_instapr — подбирает блогеров для пиара.

  • TGStat Bot — собирает статистику TG-каналов.

  • Combot — собирает аналитику TG-чатов.

Другое рабочее:

  • TGhost — создает ссылку на файл.

  • DR.Web — проверяет файлы и ссылки на вирусы.

  • PresentationRobot — помогает создать презентацию по структуре.

  • SmartSpeech Bot — превращает голосовые сообщения в текст.

  • UTM Generator — добавляет UTM-метки на ссылки.

  • Pomodoro Bot — управляет временем по методу Помодоро.

  • Биржа фрилансеров — ищет подрядчиков на проектную работу.

Если есть, что добавить, отправляйте в комментариях.

Теги:
Всего голосов 9: ↑7 и ↓2+5
Комментарии2

Представлено расширение для браузеров на базе Chrome под названием «ЮБуст — Ускорение YouTube. Ютуб без замедления в России». Лучше проверять его работу на отдельном ПК или ВМ. Открытого кода проекта не опубликовано.

С этим расширением видео в YouTube даже в 4К грузятся как было до 1 августа.

  1. Скачивайте расширения — тут.

  2. Отключите другие способы растормаживания платформы, если они у вас есть.

  3. Работает только на одной вкладке — не открывайте несколько вкладок с YouTube одновременно.

  4. Перезагрузите страницу.

  5. Ролики работают, как раньше.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии2

Подмосковный интернет-провайдер ОНС24 опубликовал уведомление для абонентов о замедлении YouTube до «непозволительных скоростей» и его возможном закрытии.

YouTube, Google всё. Уважаемые абоненты компании ОНС24 и других провайдеров. В связи с решением правительства доступ к сервисам компании Google, включая Youtube, замедлен до непозволительных скоростей. Мы, как провайдер, как и другие провайдеры, повлиять на ситуацию не можем. Просьба отнестись с пониманием.

ОНС24

Через несколько часов плашку убрали, а на её месте появился следующий текст:

Тут была новость

Которую все уже видели, но она сейчас временно скрыта.

Мы прорабатываем вопрос, этот важный вопрос прорабатывают ещё много хороших людей из различных структур, о результатах обязательно сообщим.

Теги:
Всего голосов 3: ↑3 и ↓0+7
Комментарии2