Обновить
128K+

Работа с видео *

Все о создании и обработке видео

85,26
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Как я собрал бота, который превращает доклады в вертикальные ролики: Whisper, поиск хайлайтов через LLM и проход ffmpeg

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели9.5K

Привет, Хабр! Меня зовут Андрей, и сегодня я хочу поделиться, как устроен пайплайн автонарезки выступлений с конференций (со спикером, субтитрами и его слайдами): где помогает LLM, почему субтитры рисуются через drawtext, а не .ass, и как собрать композицию «спикер + субтитры + слайд» одним проходом ffmpeg. С конкретным решением и граблями, на которые я сам наступил

Узнать побольше

Новости

Из 360°-панорамы авто в настоящий 3D: Gaussian Splatting на чужих фотографиях машин

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5.2K

Наткнулся на рекламу сайта продажи авто в телеграме. Зашёл на сайт из любопытства, потыкал объявления и наткнулся на фичу — «3D-панорама». Зажимаешь, ведёшь пальцем, машина поворачивается перед тобой. Понял, что это просто карусель из изображений, а почему бы не сделать настоящую 3D-панораму?

Читать далее

Сколько стоит вирусный ролик на нейросетях: разбираем экономику на примере 40 видео

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели8.1K

Я занимаюсь маркетинговыми коммуникациями в СИБУРе. Мы продвигаем готовые решения из полимеров (называем их инициативами): поликарбонат для строительства, кабели, бочки, поддоны, упаковочные решения, рукава для хранения зерна, трубы для пожаротушения и многое другое. Каждое направление – это отдельная инициатива со своей аудиторией. Больше половины продуктов — глубокий B2B, про который обычный человек никогда не задумывается. При этом всё нужно объяснять рынку: что такое полимерный стакан, зачем нужен рукав для зерна, и что в проводах тоже есть полимеры.

Читать далее

Как я пытался создать шедевр в Qwen, Luma и Pika, и что из этого вышло

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели12K

Помните, как полтора-два года назад в коротких видео стали появляться видео сомнительного качества, которые можно с легкостью пометить как сгенерированные? С тех пор их количество заметно упало. 

Мы решили провести эксперимент и выяснить, действительно ли некачественные видео, созданные нейросетями, исчезли, или люди научились делать настолько хорошие ролики, что мы уже перестали определять, кто есть кто. В этой статье попробуем сгенерировать такие видео (или еще качественнее).

Читать далее

Macromedia Flash: как создавался и как защищали один из самых популярных плагинов нулевых

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели16K

Кто не пользовался плагином Flash Player, на котором «висела» вся анимация, игры и мультимедиа на заре веб-эры? Покажите мне этого человека! Наверное, не найдется такого. Все те, у кого был ПК в нулевые, использовали эту волшебную разработку и, наверное, сейчас вспоминают о ней с долей благодарности и признательности. Почему же технология Flash Player, созданная Macromedia, канула в лету — разберемся далее.

Читать далее

Особенности культурного кода во французской мультипликации

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели10K

Введение

Изучая французский язык, в том числе, на примерах мультипликационных роликов и мультфильмов, обратил внимание, что там нередко можно встретить высказывания, напоминающие программные поведенческие установки для детей. По крайней мере, они оказывают определенное влияние даже на взрослых, не говоря уже об их основной целевой аудитории.

Известно, что шаблоны поведения любимых героев, с которыми мы знакомимся в детстве, могут оказывать влияние во всей нашей дальнейшей жизни.

Поэтому, знакомство с подобными паттернами поведения в чужой культуре, позволяет лучше понять логику действий не только простых граждан, но и их элит.

Естественно, что главные знания о взаимоотношении с окружающим миром закладываются в более позднем возрасте, например, в студенческой среде.

Тем не менее, детские установки «правильного» или «хорошего» поведения имеют колоссальное значение в жизни каждого взрослого.

В этой статье, мы разберем несколько примеров и дадим им свою оценку. Развитие этой темы, со стороны читателей, будет только приветствоваться.

Ролик «Le petit frere» («Младший брат»)

Посмотреть видео (рис. 1) с двуязычными субтитрами можно в https://my.mail.ru/mail/emmerald/video/_myvideo/2.html :

Читать далее

Запись потокового видео в роутер: MikroTik RouterOS Script

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели10K

Одна из моих IP камер перестала сохранять настройки для FTP сервера и перестала в него писать. В остальном она работает, поток RTSP смотреть можно. Камера писала в формате DAV, а роутер будет писать как получится.

Роутер тот самый, что пишет онлайн радио в себя и делает другие безобразия. Надо бы ему, наверно, уже имя дать.

А получится так: rtsp из камеры, в бесплатное облако, из облака m4s куски в роутер и потом ffmpeg склеит их в mp4 на компе.

Смотреть далее

Минутка кринжа или как я мультики генерил

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели6.4K

Давно хотелось влезть в тему генерации видео, но всё не доходили руки. А поскольку мне сильно не нравится современная мультипликация по сравнению с советской (в советской мультипликации, как по мне, были куда лучше и спокойнее образы и краски — смотреть их намного приятнее), то решил начать пробовать генерацию именно с мультиков.

Нашел простенькую сказку — «Колосок» — и стал искать, как в целом можно генерировать видео-контент своими руками.

Если вам было интересно погенерировать видео на открытых моделях и посмотреть, что из этого получится — эта статья как раз про это. Можно наглядно посмотреть результат

Читать далее

Украсть пиксели и не задохнуться в сетевом канале. Возможности трансляции экрана в Windows

Уровень сложностиСредний
Время на прочтение23 мин
Охват и читатели5.6K

...или Протокол SPICE в современном графическом стеке, часть 3.

Мы продолжаем увлекательное путешествие по миру удалённого доступа. Это третья часть цикла про протокол доставки рабочего стола SPICE и то, как он вынужден работать в современных условиях.

Наша конечная цель - создать пилот стримингового агента для виртуальной машины на ОС Windows. В предыдущих двух частях рассматривали архитектуры самого протокола и графической подсистемы Windows, а сегодня мы готовим плацдарм в вопросах захвата экрана в Windows и сжатия видео средствами различных библиотек, фреймворков и API. С кодом и компактными пояснениями.

Приглашаю под кат всех любознательных - в особенности тех, кто сталкивается с Windows не только как пользователь; с решениями для удалённого доступа; с протоколом SPICE; с системами виртуализации и виртуальными машинами в принципе.

К технологиям доставки рабочего стола

Недостающее звено при обработке медиа на Go

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели10K

Большинство медиа-библиотек для Go рано или поздно упираются в одну и ту же проблему.

У них нет собственного декодера.

Вместо этого они полагаются на установленный в системе пакет FFmpeg, shared библиотеки, платформозависимые DLL или внешние исполняемые файлы, которые должны присутствовать на целевой системе.

На этапе разработки всё работает. Затем начинается развертывание.

И внезапно вы отлаживаете отсутствующие DLL в Windows, несовместимые версии FFmpeg в Linux, различия версий из Homebrew на macOS, образы контейнеров без нужных библиотек или продуктовые серверы, где рядовое обновление пакета неожиданно ломает обработку медиа.

Читать далее

Какой форм-фактор видеокамер выбрать?

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели6.6K

Этот вопрос спрашивает каждый второй клиент, обращающийся за системой видеонаблюдения. У каждого свой вкус, поэтому наше мнение – лишь наш вкус от Спецлаб:

Поехали...

Зачем мне фото- и видеоредакторы с GUI, когда есть FFmpeg?

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели19K

...или записки из палаты Линуксоида

Часто ли вам пригождается базовая обработка фото или видео? Понизить разрешение, вырезать область, нанести текст, перекодировать в другой формат и другие задачи. Раньше я пользовался для этих целей самыми разными средствами - загрузка в веб-редакторы, Paint, Photoshop, Sony Vegas.

Пока в один прекрасный момент не пересел на Linux...Удобного видеоредактора для себя не нашёл, а к рабочему процессу в командной строке и установке через dnf install уже привык (я использую Fedora). И понеслась...

Внутри - интересная справка по FFmpeg. Ничего лишнего, максимум примеров с визуализацией и компактными объяснениями. Покажу, какие задачи можно решать с помощью этого инструмента не выходя из командной строки - а таких очень много. В конце - личный опыт: зачем мне эта шизофрения понадобилась и что она мне дала.

Увидеть нестандартный workflow

Когда реклама — искусство на стыке форм. Три истории о том, как консоли продавали через угрозы, сюрреализм и метафоры

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели10K

А вы тоже перестали обращать внимание на рекламу? Не один же я за последние лет 10 развил в себе баннерную слепоту настолько, что перестал воспринимать даже ту самую «классическую» рекламу, которая раньше прерывала просмотр кино по вечерам.

И ведь что самое интересное — к тем самым роликам иногда подходили на уровне настоящего кино и с подачей, смысл которой разбирали потом годами.

Не верите? А тогда давайте вспомним несколько примеров самой интересной игровой рекламы из прошлого.

Дальше много интересного

Ближайшие события

Нейросетевой апскейлинг: как собрать все грабли и почему очевидные настройки всё портят

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели12K

В своих прошлых статьях «Три пути к 4K» и «Нейросетевой апскейлинг дома» я рассказывал о выборе софта, базовых принципах нейросетевого апскейлинга и реставрации исходников уровня DVD и VHS. Но время идёт, навыки растут, и вот от простого (кусок дерева -> игрушка) мы переходим к сложному (игрушка -> коллекционная фигурка), а именно на территорию 720p–1080p исходников, Blu-ray и вебки.

И именно здесь для меня началось то, что я назвал «долиной отчаяния».

Вы берёте отличный исходник, выбираете крутую open-source модель, запускаете рендер… и всегда получаете что-то странное на выходе. Цвета поплыли, контраст упал, на градиентах неба появились какие-то искажённые линии, а ваш FPS в процессе ужасен. Кажется, что ПО сломано, а ИИ-модели взбесились и вместо «качественного апскейла» портят картинку.

Но я не сдался и пробыл в этой кроличьей норе из медиаформатов и апскейлеров более чем полмесяца, собрав все грабли с до смешного прозаичными, но не всегда очевидными решениями. И прежде чем найти истоки проблем, мы кратко разберём теорию, а после — практические решения по каждому из шагов. И, забегая вперёд: на первый взгляд здесь абсолютно всё контринтуитивно.

Читать далее

Telegram-бот, который молча скачивает видео по ссылкам в групповых чатах: как это сделать, не ломая приватность

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели9.4K

Существует продуктовый паттерн, который я редко вижу разобранным в технических статьях на русском: бот в групповом чате, который реагирует не на команды, а на содержимое обычных сообщений участников. Юзер кидает в чат ссылку на Instagram Reels — бот молча присылает видео файлом под этой ссылкой. Никаких /download, никаких упоминаний @bot, никаких inline-режимов.

Звучит просто. На практике — десяток подводных камней: Telegram Bot API в группах работает иначе, чем в личках; privacy mode ломает половину очевидных решений; flood-control прибьёт наивную реализацию на третьем активном чате; и есть отдельная проблема — как не превратить бота в спам-машину, которая реагирует на каждый https-ссылку в чате и раздражает участников.

Эту статью пишу как разработчик такого бота. Цифры из моего прода маленькие — 31 групповой чат, 380 пользователей в личке за месяц жизни — но проблемы в коде ровно те же, что были бы и при 31000 чатов. Хочу разобрать архитектурные решения, к которым пришёл, и услышать, как делали бы вы.

Читать далее

Топ-5 лучших нейросетей 2026 года: полный список на любой случай в SpeShu.AI

Время на прочтение5 мин
Охват и читатели11K

Если кто-то уверенно называет одну лучшую нейросеть, он либо продает подписку, либо давно не открывал ничего кроме этого чат-бота. Авторитетные медиа перестали смотреть на ИИ как на один общий рейтинг. TechRadar пишет, что доминирование ChatGPT в AI-chatbot рынке снижается, а Gemini, Perplexity, Copilot и Claude забирают часть аудитории. Люди начали пользоваться несколькими нейросетями под разные задачи, а не одной моделью на всё.

Artificial Analysis сравнивает популярные нейросети не только по «умности», но и по цене, скорости, контексту и другим параметрам. Arena Leaderboard показывает модели отдельно по тексту, изображениями и другим направлениям. 

Ниже — подборка нейросетей 2026 года, которые чаще всего закрывают рабочие сценарии: от текста и кода до исследований, визуалов и быстрых реакций на инфоповоды.

Читать далее

Как сделать шрифт футуристичным

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели9.7K

Как мы уже убедились, Eurostile Bold Extended замечательно подходит для определения временного периода действия фильма. Но если Eurostile недостаточно, то этой цели можно достичь и другими способами. Представляю вашему вниманию шесть простых правил, которые чётко дадут понять, что текст используется именно в будущем.

Начнём с простого текста без засечек, например, произвольно выбранного слова, написанного Eurostile Bold. Пока он выглядит, как будто действие происходит в 2016 году.

Читать далее

Топ-3 нейросети для генерации изображений: какую выбрать в 2026 году в SpeShu.AI

Время на прочтение4 мин
Охват и читатели7.8K

В этом обзоре разберём три нейросети для генерации изображений: ChatGPT Image, Nano Banana и Seedream. Посмотрим, где каждая сильна, где может подвести и какую модель лучше брать под соцсети, рекламу, инфографику, мемы, карточки товаров и сложные визуальные сцены.

Читать далее

Шрифт для будущего: Eurostile

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели11K

За долгие годы Eurostile, и в частности его вариант Bold Extended, появлялся во множестве научно-фантастических проектов. Дошло до того, что само присутствие Eurostile Bold Extended в названии заявляет, что дело происходит в будущем, намного эффективнее, чем кадр с дорогостоящими эффектами.

И в самом деле, Eurostile стал настолько быстрым способом задания временных рамок произведения, что когда я вижу этот шрифт в реальной жизни (а в Калифорнии это происходит довольно часто), то ощущаю, что попал в какую-то футуристическую антиутопию, в которой дом престарелых больше похож на зловещее правительственное учреждение для научных опытов.

Чаще всего в произведениях Eurostile встречается в виде Bold Extended, однако время от времени встречаются Regular, Bold и Regular Extended. В статье я решил показать как можно больше примеров.

Читать далее

Как оживить фото нейросетью Kling 3.0: пошаговый гайд с промптами в SpeShu.AI

Время на прочтение3 мин
Охват и читатели6.1K

Kling 3.0 — текущий лидер в сегменте Image-to-Video. В отличие от предыдущих итераций, здесь глубже проработан Diffusion Transformer (DiT) — механизм внимания к исходному кадру. Благодаря ему нейросеть не дорисовывает кадры сама, а моделирует их на базе объектов.

В этой статье разберём, как оживить фото, сохранив анатомическую точность и текстуры. Бонусом 3 готовых промпта для теста модели.

Читать далее
1
23 ...