Обновить
96.63

Работа с видео *

Все о создании и обработке видео

Сначала показывать
Порог рейтинга
Уровень сложности

«История игрушек» уже не такая, какой вы её помните

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4.5K

«История игрушек» выглядела иначе, но объяснить это будет немного сложно.

В 1995 году компьютерная графика была самой важной темой в индустрии, и в центре этого ажиотажа находилась Pixar. Эта студия уже заставила Disney перейти на компьютеры и выиграла первый Оскар за компьютерную короткометражку (Tin Toy). ПО Pixar использовалось в крупных голливудских фильмах наподобие «Парка юрского периода».

Следующим шагом стала «История игрушек» (Toy Story), которую рекламировали как первую анимационную картину, полностью созданную в компьютерной графике1. Даже после предыдущих успехов Pixar этот шаг оставался рискованным. Будут ли продаваться билеты на полностью цифровой фильм?

Как мы уже знаем, у студии всё получилось. «Историю игрушек» выпустили тридцать лет назад, в ноябре 1995 года, и её популярность сформировала тот мир анимации, в котором мы живём сейчас. Индустрию покорил новый технологический процесс.

Читать далее

Новости

Archivist: Как я учил нейросеть понимать физику плёнки, вместо того чтобы просто размывать шум

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели20K

В прошлых статьях я разбирал основы апскейлинга дома и сходил с ума, вырезая закадровый смех из «Скуби-Ду». Тот опыт привёл меня к выводу: существующие инструменты, будь то плагины вроде NeatVideo или комбайны типа Topaz Video AI — это «чёрные ящики». У них ограниченный набор настроек, и они часто пасуют перед специфическими задачами старой анимации.

В этот раз я пошёл от обратного. Сразу снижу градус ожиданий: это любительский эксперимент. Мы сильно ограничены в мощности GPU (в наличии только RTX 4060 Ti), из-за чего натренировать реально точную, тяжелую нейросеть-универсала возможности нет.

Поэтому вместо гонки за идеальными метриками я сосредоточился на «неудобных» проблемах. Я написал симулятор уничтожения плёнки, чтобы научить легкую модель понимать физику конкретных дефектов: от сдвига эмульсии до химических ожогов.

Спойлер: на это ушло 2 месяца и 2 миллиона итераций. Получилась не «волшебная кнопка», а набор узкоспециализированных инструментов.

Читать далее

Генерируем новогодние картинки и видео с Kandinsky 5.0

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели11K

Всем привет! Месяц назад на конференции «AI Journey» мы представили линейку моделей нового поколения Kandinsky 5.0 Image & Video. Мы опубликовали код и веса моделей в открытом доступе для разработчиков, а также открыли доступ к новым моделям на всех площадках GigaChat: в Telegram, мессенджере Max, на сайте giga.chat, а также в приложении под Android. Для тех, кто хочет поглубже погрузиться в технические подробности, советуем прочитать техническую статью. А для тех, кому уже хватит архитектур, параметров и кода, а хочется салатов и Нового года — наш сегодняшний материал, в котором будет много ёлок, гирлянд и снега. В этой статье мы расскажем, как сделать отличные, новогодние и не только генерации, и надеемся, что вы получите от работы с моделью такое же удовольствие, как и мы. Спасибо, что интересуетесь и пользуетесь нашими моделями! С наступающим Новым годом!

Читать далее

Сколько VRAM нужно для нейросетей?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели18K

Этот пост будет полезен людям, кто хочет разобраться в локальных моделях, особенно использующим их, как инструмент в создании контента, арта и дизайна (контекст нейросетей - image и video). Так же поговорим о выборе видеокарты и параметрах влияющих на генеративные workflow.

Telegram

Читать далее

Эволюция плеера RUTUBE: от монолита к гибким модулям

Время на прочтение11 мин
Охват и читатели8.3K

Принимая архитектурные решения, часто так или иначе приходится идти на компромисс: между качеством и скоростью разработки, сложностью реализации и удобством поддержки, быстротой решения бизнес-задачи и гибкостью. Со временем небольшие уступки накапливаются и проект покрывается легаси. Даже если исправно разгребать техдолг, то в любом случае на достаточно длинной дистанции решения и технологии устареют, и станет невозможно обойтись «генеральной уборкой» — потребуется смена архитектуры.  

В статье расскажу, как мы столкнулись с неизбежной необходимостью переделки веб-плеера RUTUBE — сервиса, который существует с 2006 года, пережил несколько смен команд и парадигм разработки и при этом достаточно большой и высоконагруженный, чтобы нельзя было «просто так взять и всё переписать». 

Читать далее

Бэкап и хранение видео в YouTube

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.7K

Когда‑то мне виделась отличная идея использовать YouTube как надёжное облачное хранилище для своих видеоархивов. Зачем тратить место на локальных дисках, если можно выгружать туда смонтированные ролики или склеенные клипы — всё удобно, всегда доступно с любого устройства в любой момент, без необходимости хранить копии локально. Доступ через браузер или приложение, бесконечное онлайн-хранилище, и видео якобы остаётся в первозданном виде. Но со временем выяснилось, что не всё так просто и безоблачно, как казалось на первый взгляд. Давайте разберёмся, что пошло не так.

Читать далее

Телевизионные передачи 90-х

Уровень сложностиПростой
Время на прочтение13 мин
Охват и читатели17K

Это глава из цикла статей «История игровой журналистики в России».

На ТВ компьютерные игры впервые появились в советских тележурналах («Наука и техника»«Хочу всё знать») и научных фильмах. Распространённый сюжет подобных передач: советских детей знакомят с устройством современных ЭВМ и обучают основам программирования.

Иногда в передачах рассказывали о сборке компьютеров на советских приборных заводах. В репортажах программы «Время» компьютерные игры называли «обучающими программами, которые развивают быстроту реакции, логику и сообразительность».

Читать далее

Как записать видео с экрана: простые способы для новичков

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели5.9K

Встретился недавно с приятелем, разговорились, и между делом он мне пожаловался — третий день «бодается» с техподдержкой. Программа у него вылетает постоянно на одном месте без видимых причин. Ему присылают варианты решения, но ни один из них не подходит. А он не может объяснить, в чем проблема. Я посочувствовал, но резонно спросил — а чего ты им не пришлешь скринкаст: можно же не объяснять, а показать? И тут выяснилось, что товарищ просто не знает, как сделать запись экрана на компьютере.

Я, конечно, объяснил. Но подумал — а вдруг кто-то тоже не умеет сохранять скринкасты. А ведь это очень полезная функция. Например, недавно я с помощью экранного видео объяснял маме, как поменять способ оплаты в онлайн-магазине — получилось куда быстрее, чем на словах. А до этого сохраненный видеозвонок помог мне доказать заказчику, что он был не прав, и изначально мы договаривались вообще о другом. Так что с заботой о друзьях и подписчиках подготовил статью с обзором простых скринрекордеров, и даже не поленился составить инструкции к каждому инструменту.

Читать далее

Kandinsky 5.0 — нейросеть от Сбера для генерации изображений и видео

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели8K

В ноябре 2025 года инженеры “Сбера” представили семейство мультимодальных моделей Kandinsky 5.0 - новое поколение нейросетей, способных создавать как статичные изображения, так и видеоконтент по текстовому описанию. 

Мы детально рассмотрим три ключевые модели, выпущенные в рамках Kandinsky 5.0: легковесную Kandinsky 5.0 Image Lite (6B параметров) для быстрой генерации изображений, мощную Kandinsky 5.0 Video Pro (19B параметров) для создания качественного видео и экономичную Kandinsky 5.0 Video Lite (2B параметров) для ускоренной обработки и экспериментов. 

Читать далее

Видеокодек AV2 готов. Почему нам важны открытые стандарты

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели15K

Новые видеокодеки моментально улучшают жизнь миллионов людей. Тем не нужно прикладывать практически никаких усилий, разве что обновить железо или софт. После этого видеофайлы магически уменьшаются в размере, качество картинки становится лучше, видео в интернете перестаёт тормозить и т. д. Например, новый видеокодек AV2 уменьшает трафик на 30%.

Единственный недостаток — время кодирования увеличивается, потому что используются сложные интеллектуальные технологии (например, психофизические модели зрения и мозга, новые способы предсказания будущего (межкадровых изменений) по предыдущим кадрам, последние открытия в математике (вроде треллис-квантования). Появляется ощущение некоего волшебства. Вообще, эффективное сжатие напрямую связано с пониманием данных, то есть с уровнем интеллекта. Чем глубже понимание смысла, тем больше мы видим аналогий, паттернов, циклов и рекурсий, которые можно использовать для «упаковки» информации.

Как говорится, достаточно продвинутая технология неотличима от магии. Так и видеокодеки нового поколения — это настоящая программная магия.

Читать далее

Миграция высоконагруженной инфраструктуры без даунтайма: технические детали переезда Дзена на видеоплатформу VK

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели6.5K

Привет, Хабр! Меня зовут Влад Почернин, я разработчик в команде видеоформатов Дзена. Сегодня я расскажу, как мы мигрировали контент Дзена на видеоплатформу VK — инфраструктуру, обслуживающую видеоконтент соцплатформ ВКонтакте и Одноклассники, а также видеосервисов VK Видео и VK Клипы.

Читать далее

Сплиттеры для проектирования видеостен. Обзор на модели брендов PC Vision и Matrox

Время на прочтение4 мин
Охват и читатели5.3K

В этой статье мы расскажем об основных технических особенностях и преимуществах видеосплиттеров для проектирования видеостен. Среди всего многообразия видеоконтроллеров, представленных на рынке, мы остановили свой выбор на двух брендах, способных составить достойную конкуренцию, - PC Vision и Matrox. Также мы рассмотрим их применение в различных конфигурациях и разрешениях.

Читать далее

Apple собирается в Китае, но остаётся американской компанией. Почему тогда российские компании считают «китайскими»?

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели10K

Есть один любопытный феномен, который регулярно всплывает в обсуждениях. Стоит только упомянуть, что какая-то часть элементов устройства делается в Китае, — и моментально появляется комментарий формата:
Ну если элементы у вас китайские, то компания у вас тоже, наверное, китайская?

Меня такая логика поначалу удивляла, но потом понял, откуда она берётся. Люди, далёкие от инженерии, искренне думают, что раз деталь произведена в определённой стране — значит и продукт должен быть оттуда. Как будто компонент несёт в себе национальность, как паспорт.

Разбираемся как всё устроено в российской электронике от лица инженера.

Читать далее

Ближайшие события

4 приоритетные функции, которых не хватает генераторам видео

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели6.7K

Я продолжаю свой квест по прокачке генеративных кадров с целью сделать их более кинематографичными. Разбирая сложности, с которыми я столкнулась при создании музыкального клипа, я выделила главную проблему ИИ – он не понимает пространство. Это лишает ИИ-видео возможности полноценного мизансценирования, а значит, превращает его в анти-кино.

Интеграция 3D-моделей пространства – дело долгое, технически сложное, а идеологически (для продукта массового пользования) – сомнительное. Поэтому я выделила функции, которые кажутся мне реальными, лежащими в зоне ближайшего развития.

Последняя прорывная модель у ведущих генераторов – Veo3. Следующие апдейты никак не приблизили меня к решению моей задачи – получить мизансценический контроль, т.е, быть в полном смысле слова постановщиком. Есть ощущение, что генеративное видео для широкого пользователя достигло некоего плато и раздумывает, что делать дальше. Вдруг я что-то угадаю?

Читать далее

Работа с RTSP-плеером во Flutter: выбор библиотеки и снижение задержки

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели7.1K

Работа с RTSP-потоками во Flutter остаётся задачей, которую нельзя решить штатными средствами фреймворка. Базовый плагин video_player не поддерживает RTSP, из-за чего прямое воспроизведение видео с IP-камер и систем наблюдения недоступно без сторонних решений. Для корректной работы в таких сценариях требуется специализированный плеер, обеспечивающий стабильное отображение потока и минимально возможную задержку.

В данной статье мы рассмотрим основные библиотеки для работы с RTSP во Flutter — flutter_vlc_player, fijkplayer и media_kit, сравним их особенности, достоинства и влияние на задержку воспроизведения. Отдельное внимание уделим настройкам, которые позволяют минимизировать latency, прежде всего в решениях на базе FFmpeg. Также разберём доступные параметры оптимизации в flutter_vlc_player. 

Материал поможет выбрать подходящую библиотеку и настроить плеер так, чтобы обеспечить быстрый старт потока, минимальную задержку и стабильную работу в практических сценариях.

Читать далее

Как мы улучшили качество сервиса VK Видео на SmartTV

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели7.4K

Видео стало неотъемлемой частью нашей жизни: мы смотрим его на смартфонах, ноутбуках и всё чаще — на телевизорах. Несмотря на то, что видеосервисы традиционно ориентировались на мобильные устройства, за длинным контентом пользователи идут именно на большие экраны, и это подтверждается ростом времени просмотра. Сегодня среднее дневное время смотрения VK Видео на Smart TV достигает 216 минут.

И тут начинается самое интересное: телевизоры — это особый мир со своими капризами и законами. Официальные спецификации обещают поддержку HLS, DASH, 4K, 60 FPS. На практике поддержка функций зависит не столько от новизны модели, сколько от того, как это реализовано у конкретного производителя. В одних устройствах всё работает корректно, в других — частично или вовсе не запускается. Новая модель при этом не всегда гарантирует лучшее воспроизведение видео.

Меня зовут Игорь Горяйнов, я программист в команде веб-технологий Единой видеоплатформы VK. Ниже расскажу, как команда прошла путь от нативных плееров к собственному веб-решению для ТВ, какие задачи пришлось решать и что это дало пользователям.

Читать далее

Датасет VK-LSVD помогает тестировать алгоритмы рекомендаций: сейчас на его базе проходит VK RecSys Challenge

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.5K

Сейчас в открытом доступе мало крупных датасетов сервисов коротких видео, но это уникальный формат для рекомендательных алгоритмов. В отличие от музыки или длинных видео они не могут потребляться в фоновом режиме, а каждый показанный ролик получает от пользователя реакцию. Даже если он не оставит лайк, досмотр видео до конца или пропуск уже считаются обратной связью. Именно поэтому мы выложили в открытый доступ датасет VK-LSVD. С его помощью инженеры и ученые смогут развивать и совершенствовать рекомендательные алгоритмы.

Как работать с VK-LSVD

Какой AI-сервис лучше всего делает короткие клипы и адаптирует ролики для разных платформ? Проверила 4 ИИ-сервиса

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.8K

Каждый, кто делает видео для соцсетей или образовательных проектов, знает: поиск топовых моментов, нарезка клипов, брендинг и публикация отнимает не мало времени. Хорошо, что ИИ уже может сделать 80% работы: автоматический монтаж, субтитры, перевод, нарезка клипов и адаптация для разных площадок. 

Я протестировала 4 топовых сервиса, которые чаще называют “YouTube Shorts & Reels factory”. Так что мы с вами разберемся, какой сервис лучше выбрать под ваши задачи, и что подходит для рынка РФ и СНГ, а что дает лишь ложные надежды.

Читать далее

Сексуальный подтекст андроида Эша или как Бильбо Бэггинс попал в фильм непонятной категории

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели17K

Приветствую, дорогие читатели. Помните, в фильме «Чужой» (если смотрели) андроид Эш засовывает Рипли свёрнутый порнографический журнал в рот, дабы не отвечать на поток женских вопросов касательно сложившейся ситуации? Метод, конечно, радикальный и мы его осуждаем, но чертовски эффективный. Так вот, на самом деле  это ещё одна метафора изнасилования. Робот испытывает влечение к женщине, но как типичный гик, оставшись с ней в одной комнате, не знает, что делать и как совладать с бурей необычных для себя эмоций. Итог — брызги на стенах и оторванная голова. Как так получилось? Давайте разбираться.

— Я не могу лгать насчет ваших шансов, но…

Анализ аудио потока HLS с помощью Web Audio API и hls.js

Время на прочтение7 мин
Охват и читатели11K

В современных веб-приложениях для потокового видео всё чаще требуется не просто воспроизводить контент, но и анализировать аудиодорожку в реальном времени. Например, строить индикаторы уровня громкости (VU/PPM метры), визуализировать спектрограммы или детектировать тишину. В этой статье разберём, как корректно объединить hls.js и Web Audio API для анализа аудио из HLS-потока в браузере, избежав типичных подводных камней.

Читать далее
1
23 ...

Вклад авторов