@PatientZero31 авг в 12:32

Мой удивительно быстрый видеокодек для стриминга

Средний

10 мин

15K

Работа с видео * Игры и игровые консолиВидеокарты

Перевод

+47

Комментарии 36

@n0isy 31 авг в 13:38

Приветствую! Хорошая техническая статья. А можно для неспециалиста пояснить: мы жмём исходный поток во сколько раз? Если судить о 1.4гб/200Мб, то это x7 ?
Какие сферы применения вы предполагаете? Облачный гейминг? (Большеват все таки бюджет по полосе).

@old_bear 31 авг в 15:09

Плашка в начале статьи намекает что это перевод...

@Torvald3d 1 сен в 12:19

Вряд ли облачный с таким битрейтом, скорее просто удаленный дисплей по локалке, типа ПК в одной комнате, а девайс с экраном в другой. Например, стриминг с ПК на стимдек, телевизор или виар очки

@n0isy 31 авг в 13:45

И интересно, что "классическое видео" ParkJoy вообще нигде не выложено в открытый доступ. В отличие от Лены jpg. Где его можно глянуть?

@Aelliari 31 авг в 14:23

Тут, но где его брал автор - я не знаю. По кадру из статьи вроде это оно

@n0isy 31 авг в 14:58

Llm агент только после ресерча в интернете говорит о ftp и/или регистрации на шведском ресурсе. По self knowledge оно не знает что такое ParkJoy.

@takezi 31 авг в 15:00

https://media.xiph.org/video/derf/

@fivlabor 31 авг в 21:04

Почему оно "печально известное"? Какие-то проблемы с авторскими правами?

@arteast 1 сен в 04:59

Оно как Лена.jpg - традиционный фрагмент для тестирования кодеков. Лично у меня оскомину вызывает Big buck bunny (и в меньшей мере Tears of steel).

@old_bear 31 авг в 15:04

О, прямо ~~въетнамские~~ флешбэки пошли как кадр из parkjoy увидел. Насмотрелся я на него в своё время при отладке AVC-Intra кодека для ПЛИС...
Само кодирование, кстати, вполне себе реализуемо аппаратно для AVC-Intra или HEVC-Intra с потоком 100-200 мегабит в секунду и с микроскопической задержкой в 16-32 строки пикселей за счёт блочной структуры кодирования. Но вот выбрать правильную стеиень квантования чтобы уложиться в CBR, не зная заранее содержимое всего кадра - это из серии гадания по хрустальному шару. Так то по предыдущему кадру можно статистику набрать, но при резкой смене плана это не помогает. У нас даже шутка была, что каждый сотрудник компании за время работы придумывает как минимум один новый алгоритм контроля битрейта.

@graphican 31 авг в 20:13

Блоки 32х32. Сжимаю jpeg и zlib со средним сжатием. Помечаю, что занимает меньше. Объединяю в макроблоки - прямоугольные области с только jpeg и только zlib кодированием - пережимается макроблок целиком. Работает в реальном времени с приемлемым потоком. Степень сжатия регулируется только для jpeg. Если в полёте больше чем 3 кадра - сжимаем сильнее. Если 3 и меньше на протяжении секунды - немного уменьшаем сжатие до тех пор, пока не превысим 3 кадра в полёте. Это в aeroadmin реализация. Удаленное администрирование требует минимальных задержек.

Все операции многопоточно - минимум задержка

@TimurZhoraev 1 сен в 10:57

Имеются ли артефакты на границах блоков? Сжимается только покадровое изменение картины? В библиотеках самого jpeg вроде как имеется уже возможность поиграть с размером блоков DCT (lossy), а затем ещё поднастроить результат квантования (lossless).

@graphican 1 сен в 15:15

Сжатие только покадрово. Артефакты блоков не видно. Виден муар от сжатия текста jpeg. Но как-только появляется возможность, то сильно сжатые блоки обновляются с меньшим сжатием и артефакты исчезают.

В jpeg только качество выставляется и цветовое прореживание.

Нет необходимости прям точно в какой-то размер вписываться

@TimurZhoraev 1 сен в 18:37

Кстати вроде как подобный метод с переменным сжатием используется в DJVU. Там получается так что делаются из изображения слои, каждый слой это свой пространственный фильтр низкой частоты грубо говоря (например, усреднение по соседним точкам). Как только производная от изменения яркости становится большой (или в спектре появляются ВЧ-составляющие) применяется уже более мелкое сжатие локальной области. То есть сжимаются уже не исходная картина, а разбитая на эти слои, потом они снова складываются-восстанавливаются.

@TimurZhoraev 31 авг в 17:51

В ещё стародавнее время в мультиплее можно было передавать изображение игры практически мгновенно, создавая двоичный поток об этой сцене по коаксиалу 10 мбит, в качестве проигрывателя - движок самой игры, там уже и текстуры есть и всё что нужно, достаточно представлять координаты и дерево объектов.
Гипотетически, можно байткод, который и формирует это дело между GPU<->CPU перехватывать и уже отправлять непосредственно его, включая физику, а далее его восстанавливать на GPU-приёмнике, наверняка подобного рода технологию рано или поздно завезут, так как GPU в облаке как сервис и виртуальные видеокарты прямо говорят о том что это необходимо сделать, в этом случае можно рендерить хоть 8к, разумеется, для нативных фильмовых сцен это дело не подойдёт а для геймплея вполне.

НЛО прилетело и опубликовало эту надпись здесь

@TimurZhoraev 31 авг в 18:41

Ну почему же, если в качестве байткода вызывать методы того же Qt. Более того в новой почти полнофункциональной операционной системе называемой нынче "браузер" рендерить часть веб-контента AJAX-ом, то фактически эти самые JSON-XML-подобные пакеты и есть некая имитация иксов, концепт которых был ещё в середине 90-х. Можно образно сказать что фронтенд - это имитация рабочего стола и прочих элементов GUI, созданных на бекенде. А там хоть Ncurses или Turbo Vision по сети, но это уже более ранняя история.

@vivan 1 сен в 03:26

А в чем смысл? Для рендеринга потребуется такой же мощный GPU, как и в локальном варианте. Нужны текстуры, значит нужна вся игра локально (за минусом бинарника). Сэкономить CPU?

@sappience 1 сен в 03:45

Ну что вы, это же ворота в дивный новый мир. В котором нет спираченных игр, крякнутых, хакнутых, с читкодами. В котором никто не отреверсинженирит твою игру и не позаимствует решения. В котором пользователи не смогут заплатив за игру однажды играть потом, собаки такие, всю жизнь. И наигравшись перепродать игру не смогут. Пользователь вообще доступа к коду лишен. Он может только платить и получать видеопоток. Идеальный потребитель!

@TimurZhoraev 1 сен в 05:10

Именно так! Пользователь освобождается от бремени переноса к себе бинарников геймплея и физики, которые лежат на сервере а на его стороне лишь тонкий клиент с GPU для отрисовки. Аналогично все САПР-ы. Мало того, там автоматом виртуальная флешка с ключами привязанные к ГлобалУслугам (эту тему кстати не только у нас курируют, взять те же корневые сертификаты) с биометрическим ID. Ну и соответственно трафик может быть для векторной графики из разряда US Robotics 56k

@ZirakZigil 1 сен в 06:53

И какие от этого плюсы для пользователя? Текстуры, звуки, катсцены, модели, тексты и прочее это и есть 99% объёма игры. Сэкономить на паре десятков мегабайт бинарей в игре на 100 гигабайт?

@TimurZhoraev 1 сен в 10:42

Для антарктической экспедиции, когда охота поиграть с друзьями на другом континенте а видос через исчезающий Старлинк или другой спутник на высоких широтах уже не прогнать через $1Мбит \cdot c ^{-1}$ .

@ZirakZigil 3 сен в 06:13

И поэтому вместо таскания по сети только пакетов, нужных для мультиплеера, мы будем таскать те же пакеты для мультиплеера и к ним ещё пакеты, описывающие кадры? Звучит заманчиво (нет).

@TimurZhoraev 3 сен в 14:06

Нет, маленько не так, мультиплеер может содержать элементы, который производитель игры хочет скрыть, ну вроде как все хотят чтобы ЗП капала за ПО, принимаем как должное. Поэтому невозможно будет описать сцену без скрытой физики, например, в мультиплее помимо людей ещё что-то делает ИИ а также меняется сцена по какому-то алгоритму или сюжет, которого нет в синглплее. В этом случае конечно же будут пакеты которые помогают эти изменения прорисовать. На клиентской стороне только текстуры, полигоны, звук/миди, базовая физика которая в общедоступном движке ну и по мелочам сетевые протоколы и локальное хранилище. Всё остальное уже в облаке. Мало того, если канал совсем небольшой то передаваться может "усечённая сцена" или отсутствовать мелкая моторика у персонажей.

@ZirakZigil 4 сен в 06:05

На клиентской стороне только текстуры, полигоны, звук/миди, базовая физика которая в общедоступном движке

Но информацию о том, где полигоны расставить, какие текстуры на них налепить, и под какой звук — это всё будет приходить с сервера. В довесок. Иначе быть не может, а значит это потребует более широкого канала.

@vivan 1 сен в 09:26

Такое давно решается серверной логикой для ключевых механик. F2P часто такие, в том числе и синглплеерные.

@TimurZhoraev 1 сен в 10:47

Всё верно, речь идёт не о сервер-рендеринге а именно об этом действии на машине пользователя, которая выступает в качестве визуализатора, содержит терабайты текстур, демок, интро итд а по факту принимает поток графа сцены, который уже можно протолкнуть через узкополосные или падающие каналы. При этом, действительно, механика и прочее поведенческое "ноу-хау" (чтобы скрыть от читер-крякеров) из разряда ИИ, отрабатывается на игровом сервере. Вообщем это что то среднее между тонким клиентом и сервером.

@TimurZhoraev 1 сен в 05:06

А если геймплей охота глянуть через спутник, ASDL, диалап, пусть даже и спустя сотню миллисекунд, может там MMORPG 8k, такая где нужно увидеть на экране пиксель чтобы разгадать где спрятался юнит, сжатие без потерь не пойдёт, канал не позволит, с потерями - будет один большой блюр на весь экран с косинусными артефактами. То есть это потенциально индустриальная задача, когда разработчики игры, CAE/CAD/CAM могут движением мыши сгенерировать легковесный вьюер без игрового движка (99.9 это текстуры и полигоны), чтобы можно было смотреть на удалёнке что происходит, делать туторы и классрумы под сотню человек не напрягая связь. Причём это может быть универсальное решение в виде некой стандартной либы под CPU-GPU, что-то как раз из разряда x11-ов и Wayland-а, только более адаптировано под эту задачу, включающую обработку таймаутов, лагов и непрорисовок (пока что эти интерфейсы подразумевают идеальную связь)

@Asterris 1 сен в 00:55

Автор для кодирования использует топовую видеокарту, в которой уже и так есть готовый энкодер, который может выдавать аналогичное качество кодирования 🤦‍♂️

Вот если бы это всё чудо работало без GPU - тогда да. А так смысл в нем, если есть NVENC?

@Sazonov 1 сен в 01:39

Перевод вроде неплохой и содержание интересное. Но к середине статьи начинается использование кучи аббревиатур без каких-либо расшифровок и пояснений, что для неподготовленного человека проблемно.

Немного не по теме: на текущем проекте где я работаю мы используем инфраструктуру (рабочие станции) заказчика через Parsec. В принципе хватает интернет канала в 10-15 мегабайт чтобы получать картинку в 4к и без проблем видеть анимации интерфейса в той же визуал студии. Это в разы лучше чем всякие Remote Desktop / VNC и прочие. Думаю для большинства игр, за исключением киберспорта, этого тоже будет достаточно.

@zoog 2 сен в 18:38

В большинстве игр, если это не пасьянсы-зумы, людям не хватает собственных рефлексов, скоростей опроса мыши и 60-ти Гц ЛСД-мониторов для лучшего экспириенса.

@yatanai 2 сен в 08:48

Крутая штука для VR может выйти. Там не проблема локально гонять поток в +400МБит, проблема пожать картинку за приемлемое время. Если транскодирование будет занимать условных 8мс, из которых 7мс сеть, то это будет своего рода микрореволюция! Сейчас самые крутые задержки которые только получается у меня выжать на Pico это 20мс. Из которых сеть 6мс на wifi5

@n0isy 5 сен в 09:59

Странно вы считаете: как будто у вас ИЛИ сеть, ИЛИ вывод. Кадр можно и нужно выводить по-блоково.

Но даже если вы приняли целый кадр и начали выводить, это не мешает принимать следующий кадр, и таймлайн должен накладываться даже в этом случае

@lexxsu 2 сен в 11:32

Зачем изобретать "новое", когда есть JpegXS. Тот-же wavelet на весь кадр, упрощенное энтропийное кодирование, возможности предсказания из прошлого фрейма, правда возникают вопросы о стоимости лицензии.

@Valehavl 3 сен в 11:22

Motion JPEG существует уже очень давно

https://ru.m.wikipedia.org/wiki/MJPEG

@Guestishe 5 сен в 15:16

В эпоху нейронок лепить кодек вручную, ну такое себе "художество". Подобные задачи сейчас решаются многомиллиардными прогонами.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий