Обновить
81.03

Работа с видео *

Все о создании и обработке видео

Сначала показывать
Порог рейтинга
Уровень сложности

Edge AI: почти всё о видеокамерах с искусственным интеллектом. Часть 1

Время на прочтение8 мин
Охват и читатели4.3K

Привет, Хабр! Эта статья написана по мотивам доклада реверс-инженера Дмитрия Ильина для прикладной конференции по Data Sience Ai Conf 2025. В нём Дмитрий рассказывает о своём многолетнем хобби, которое родилось на стыке реверс-инжиниринга, софта и железа. Это проект OpenIPC, где IPC — это аббревиатура от IP-камера. Изначально он задумывался как специализированный дистрибутив Linux для IP-камер, но со временем превратился в большое комьюнити любителей опенсорса, каждый из которых является носителем уникального кусочка знаний.

Это будет материал из двух частей. В первой Дмитрий объясняет, как работать с видеоаналитикой, какие есть проблемы  в области Computer Vision и какие нестандартные решения можно найти сегодня.

Читать далее

Новости

Технологии в основе VK Видео: от загрузки файла до кадра на экране зрителя

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели14K

В 2025 году платформа VK Видео стала лидером в России по ежедневной и ежемесячной аудитории. За этим результатом стоит не только рост числа авторов и объёма контента. В его основе системное развитие технологий: мы последовательно масштабируем инфраструктуру, совершенствуем пайплайны обработки видео и инвестируем силы в стабильность воспроизведения на всех пользовательских устройствах и при любых условиях сети. Это постоянная инженерная работа, направленная на предсказуемое и стабильное качество сервиса при быстрорастущей нагрузке. 

Меня зовут Алексей Шпагин, я руководитель разработки бэкенда видеоплатформы VK. В статье расскажу о технологиях, лежащих в основе VK Видео, и жизненном цикле контента на платформе: от загрузки и обработки до доставки зрителям.

Загляни под капот VK Видео

От пыльного ящика до 15 FPS за 40 минут — Claude Code в промышленном IoT

Время на прочтение5 мин
Охват и читатели9K

5 лет назад мы пытались внедрить видеодетекцию движения для промышленного освещения. Программист не справился, проект лёг в ящик. В январе 2026-го я собрал работающий MVP за 40 минут с помощью Claude Code — без единого программиста нужного стека в команде.

Читать далее

Игровой канал на RuTube: итоги спустя почти год. Подписчики и доход за первый год

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели6.2K

RuTube — отечественный аналог YouTube, который, если верить российским СМИ, должен был стать  достойной заменой  «проклятому западному YouTube», после того, как у того начали якобы деградировать сервера.

Сегодня я поделюсь своим опытом ведения игрового канала на RuTube, расскажу, сколько удалось заработать, и отвечу на главный вопрос: смог ли RuTube заменить YouTube?

Спойлер: ответ вы, конечно же, уже знаете.

Читать далее

Коробка с Нейросетями

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели6.3K

Автор в телеге: Кеша (Мозг/ИИ Просто)

Ютуб версия: https://youtu.be/MaR_uPjEb6Y

Ролик-рефлексия на тему происходящего сейчас в мире.

Читать далее

VHS Decode: перед употреблением прочитать

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели10K

Входим в VHS Decode нежно и плавно. Пытаемся понять, как собрать сетап без потери интереса и визитов в ПНД.

Пакет ld-decode произвёл мини-революцию в сфере оцифровки и сделал доступным захват сырого FM сигнала для последующего декодирования. VHS Decode продолжил развитие ld-decode и значительно расширил список поддерживаемых форматов, а также увеличил скорость и улучшил качество работы.

Данная заметка рассчитана на аудиторию, уже знакомую с феноменом RF декодирования и ориентирована в первую очередь на новичков, которые хотят «вкатиться» или уже сделали первые шаги. Для более опытных юзеров были припасены не совсем очевидные факты о формате и оборудовании.

Заглянуть глубже

Нейросеть для генерации видео бесплатно

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.2K

Привет, Хабр!

Мне надоело платить подписки за генерацию видео. Каждый сервис хочет $20–50 в месяц, а если тебе нужно генерировать контент на нескольких языках, то расходы множатся. Поэтому я сделал YumCut - генератор коротких видео с открытым исходным кодом, который превращает одну текстовую идею в готовое озвученное видео. Без GPU, без дорогих подписок, без ограничений на количество.

В этой статье расскажу, как он устроен, какие технические решения пришлось придумывать, как ИИ-агенты писали за меня код и мобильное приложение, и почему faceless-видео - это тренд, который стоит понять и использовать.

Читать далее

Language Dove: как я транскрибирую и перевожу фильмы

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели18K

Я обожаю смотреть иностранные фильмы в оригинале.

Во-первых, мне нравится расширять кругозор, погружаться в другую культуру, расшифровывать структуру разных языков, пополнять словарный запас.

Во-вторых, мне просто нравится звучание некоторых языков - например, французского, китайского, датского.

Также я работаю над сайтом по изучению языков Language Dove, а учить языки по фильмам - это очень эффективно.

Так родился проект по генерации идеальных субтитров.

Читать далее

Уменьшаем зависания и оптимизируем потребление трафика: как команда VK Видео работает с viewport на Android

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели8.1K

VK Видео — один из крупнейших видеосервисов в России. В декабре 2025 года его ежемесячная аудитория достигла 81,5 млн пользователей. А в первую неделю января 2026 года среднесуточная аудитория VK Видео превысила 42 млн человек (без учёта просмотров на Smart TV и встраиваемых плееров, по данным Mediascope). 

Часть аудитории пользуется сервисом на устройствах Android. Для работы с видео на Android у VK есть единое решение — SDK OneVideo Player. Оно основано на библиотеке Media3 и содержит много улучшений и доработок в части проигрывания видео. Одна из таких оптимизаций — адаптация видео под viewport.

Меня зовут Егор Баженов. Я Android-разработчик в команде видеоплатформы VK. В этой статье я расскажу, как мы внедрили адаптацию под viewport в нашу библиотекуи каких результатов это позволило достичь.

Читать далее

Топ нейросетей и ИИ-сервисов 2026 года: лучшие ИИ-инструменты

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели18K

2026 год. Нейросети – теперь рабочий инструмент, который есть почти у каждого.

Но в этом и проблема: их стало так много, что глаза разбегаются. Только собрался освоить один сервис – тут же выходит другой, который обещает быть лучше, быстрее и дешевле. Как не утонуть в этом потоке и выбрать то, что действительно работает?

Мы решили помочь и протестировали 25 нейросетей для самых разных задач: от генерации текста и видео до создания музыки и презентаций. В этом обзоре вы найдёте не только известных гигантов вроде ChatGPT 5.2 или Gemini 3, но и другие решения: ChatPDF для документов, SlidesAI для слайдов, Suno для музыки и отечественный “Кандинский” для изображений.

Если вы устали от поиска «той самой нейросети» – эта статья станет вашей картой сокровищ.

Читать далее

Эволюция ip камер: от «хвостов» к встроенным клеммникам в монтажной коробке

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели11K

Меня зовут Сергей, я работаю инженером в компании по производству систем видеонаблюдения в компании из Краснодара. Здесь, на юге России,  проектируются и собираются IP-камеры видеонаблюдения, видеосервера, коммутаторы и ПО. Не просто китайский конвейер, а устройства, в которые заложена наша собственная логика, прошивка и философия.

Как и у большинства производителей, часть компонентов мы проектируем и производим сами, а часть закупаем. В том числе — за рубежом. Это нормальная практика: не всё имеет смысл изобретать заново, особенно если на рынке уже есть стандартные, отработанные решения.

Подробнее

Нейросетевой Трудности Перевода: Как я пытался обмануть TikTok с помощью ИИ и что из этого вышло

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели5.8K

В один из дней, разжижая мозг за просмотром видосов в Тик Ток я наткнулся на очень интересный (по моему мнению) гайд. В нем автор при помощи всего одной нейросети локализовал свой русскоязычный контент на другом языке - набрал 100к локальных подписчиков и начал грести лопатой деньги от прямых интеграций.

Читать далее

FFmpeg: уменьшаем размер видео

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.3K

В статье разбираю, как уменьшить размер видео на Windows с помощью open-source инструмента FFmpeg.
Показываю установку, настройку переменной PATH и простую команду для эффективного сжатия с минимальной потерей качества.
Это поможет освободить место на диске и упростить хранение и передачу видеофайлов.

Читать далее

Ближайшие события

Кейс: НейроДудь

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели9.6K

Осенью я давал интервью для документального фильма Высшей школы экономики «После промпта„. В са“»м фильм попал небольшой фрагмент, и я долго думал что делать с остальным материалом. Так появился НейроДудь.

Читать далее

Полный дуплекс по SRT на Pro Convert Audio DX: двустороннее стерео-аудио через USB и VLC

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели4.1K

1) Задача и исходные предпосылки

Требуется организовать двусторонний аудиоканал между двумя устройствами Magewell Pro Convert Audio DX поверх сети на базе SRT. Формулировка выглядит простой, однако за ней обычно скрывается типичная путаница между тремя разными сущностями:

1. Аудиоканалы (например, стерео = 2 канала L/R).

2. SRT‑потоки / SRT‑сессии (каждая сессия переносит медиапоток в одном направлении).

3. Сетевые роли Caller/Listener (кто инициирует соединение и как это проходит через NAT/динамические IP).

Euclid Lab провела воспроизводимый эксперимент на базе Pro Convert Аudio DX : подтвердить одновременную двустороннюю передачу стерео‑аудио (full‑duplex) между двумя устройствами, используя простой и прозрачный метод контроля — USB Audio + две копии VLC на каждом ПК.

Читать далее

Как мы измеряем качество в VK Видео

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели10K

Привет, Хабр. Меня зовут Павел Муханов. Я руководитель лаборатории качества видеоплатформы VK.

ВКонтакте, ОК, VK Клипы, VK Видео и другие сервисы VK, предоставляющие возможность просмотра видео, используют в качестве core-технологии видеоплатформу VK. Она объединяет видеохостинг, стриминг и облачное хранилище и предоставляет аудитории бесшовный доступ к огромной библиотеке контента. Чтобы гарантировать стабильную работу видеоплатформы — предсказуемое качество видео и корректную работу плеера, — мы в лаборатории качества внимательно следим за метриками.

В статье на примере VK Видео расскажу, как мы оцениваем качество и какие результаты получили, когда ввели регулярный мониторинг качества видео и перформанса.

Читать далее

«История игрушек» уже не такая, какой вы её помните

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели15K

«История игрушек» выглядела иначе, но объяснить это будет немного сложно.

В 1995 году компьютерная графика была самой важной темой в индустрии, и в центре этого ажиотажа находилась Pixar. Эта студия уже заставила Disney перейти на компьютеры и выиграла первый Оскар за компьютерную короткометражку (Tin Toy). ПО Pixar использовалось в крупных голливудских фильмах наподобие «Парка юрского периода».

Следующим шагом стала «История игрушек» (Toy Story), которую рекламировали как первую анимационную картину, полностью созданную в компьютерной графике1. Даже после предыдущих успехов Pixar этот шаг оставался рискованным. Будут ли продаваться билеты на полностью цифровой фильм?

Как мы уже знаем, у студии всё получилось. «Историю игрушек» выпустили тридцать лет назад, в ноябре 1995 года, и её популярность сформировала тот мир анимации, в котором мы живём сейчас. Индустрию покорил новый технологический процесс.

Читать далее

Archivist: Как я учил нейросеть понимать физику плёнки, вместо того чтобы просто размывать шум

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели34K

В прошлых статьях я разбирал основы апскейлинга дома и сходил с ума, вырезая закадровый смех из «Скуби-Ду». Тот опыт привёл меня к выводу: существующие инструменты, будь то плагины вроде NeatVideo или комбайны типа Topaz Video AI — это «чёрные ящики». У них ограниченный набор настроек, и они часто пасуют перед специфическими задачами старой анимации.

В этот раз я пошёл от обратного. Сразу снижу градус ожиданий: это любительский эксперимент. Мы сильно ограничены в мощности GPU (в наличии только RTX 4060 Ti), из-за чего натренировать реально точную, тяжелую нейросеть-универсала возможности нет.

Поэтому вместо гонки за идеальными метриками я сосредоточился на «неудобных» проблемах. Я написал симулятор уничтожения плёнки, чтобы научить легкую модель понимать физику конкретных дефектов: от сдвига эмульсии до химических ожогов.

Спойлер: на это ушло 2 месяца и 2 миллиона итераций. Получилась не «волшебная кнопка», а набор узкоспециализированных инструментов.

Читать далее

Генерируем новогодние картинки и видео с Kandinsky 5.0

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели14K

Всем привет! Месяц назад на конференции «AI Journey» мы представили линейку моделей нового поколения Kandinsky 5.0 Image & Video. Мы опубликовали код и веса моделей в открытом доступе для разработчиков, а также открыли доступ к новым моделям на всех площадках GigaChat: в Telegram, мессенджере Max, на сайте giga.chat, а также в приложении под Android. Для тех, кто хочет поглубже погрузиться в технические подробности, советуем прочитать техническую статью. А для тех, кому уже хватит архитектур, параметров и кода, а хочется салатов и Нового года — наш сегодняшний материал, в котором будет много ёлок, гирлянд и снега. В этой статье мы расскажем, как сделать отличные, новогодние и не только генерации, и надеемся, что вы получите от работы с моделью такое же удовольствие, как и мы. Спасибо, что интересуетесь и пользуетесь нашими моделями! С наступающим Новым годом!

Читать далее

Сколько VRAM нужно для нейросетей?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели19K

Этот пост будет полезен людям, кто хочет разобраться в локальных моделях, особенно использующим их, как инструмент в создании контента, арта и дизайна (контекст нейросетей - image и video). Так же поговорим о выборе видеокарты и параметрах влияющих на генеративные workflow.

Telegram

Читать далее
1
23 ...