acmer 5 янв 2011 в 18:09

Про сжатие видео — Введение

7 мин

83K

Работа с видео*

Из песочницы

+249

109

Комментарии 109

НЛО прилетело и опубликовало эту надпись здесь

acmer 5 янв 2011 в 18:32

Пожалуйста! В качестве продолжения будет непосредственно «цикл» видеокодека, а потом и проблемы в которые сегодня все упираются и методы их решения, предпринимаемые в нашей лаборатории в том числе.

Rigidus 5 янв 2011 в 18:49

Хотелось бы узнать также о том чем отличаются (алгоритмы, подходы) скринкасты от видео (с точки зрения кодирования) и какими практическими подходами стоит пользоваться при созданнии программ типа «удаленный рабочий стол»

acmer 5 янв 2011 в 18:58

Со скринкастами много чего проще:
1) Нефотографичность картинки (интерфейс ОС) => легче жмется сама по себе
2) Проще детектировать движение по векторам кандидатам (о кандидатах в следующей статье) => ровно и красивое поле векторов движения
3) После компенсации движения разностный кадр почти весь серый

Но есть и свои проблемы, особенно когда дело касается передачи в реальном времени. И некоторые традиционные алгоритмы могут безвозвратно испортить документальность какого-нибудь графика на мониторе.

soloweb 5 янв 2011 в 18:55

Да, продолжение было-бы кстати, интересуют вещи которые получены практическим путем :-)

НЛО прилетело и опубликовало эту надпись здесь

JokerOfGod 5 янв 2011 в 18:36

Меня аж передернуло от 1го скриншота, но статья интересная!

-2

acmer 5 янв 2011 в 18:43

Ну думаю от этого скриншота вас передернуло бы не меньше))

JokerOfGod 5 янв 2011 в 18:46

Это точно)))

-1

JokerOfGod 5 янв 2011 в 21:30

я вообще то про «лицо» этого зверя…

-1

sergei-grigorev 5 янв 2011 в 18:43

Мне первый скрин напомнил инструмент Track Motion в Adobe After Effects

sergei-grigorev 5 янв 2011 в 18:53

Оно примерно также выглядит, тоже отвечает за определение движения пикселей

oogl 5 янв 2011 в 18:52

Спасибо, отличная статья.

LAVir 5 янв 2011 в 18:54

Прочитал с большим удовольствием и интересом! Спасибо! Жду продолжения!

DomSecurity 5 янв 2011 в 18:55

Расскажите, что такое NALU и почему они используются вместо понятных блоков?

acmer 5 янв 2011 в 19:02

Про NALU ничего не слышал. И гугл что-то тоже не сильно.
Можно ссылку на то, что вы имели в виду?

DomSecurity 5 янв 2011 в 19:06

Это вот — en.wikipedia.org/wiki/Network_Abstraction_Layer
Network abstraction layer unit

acmer 5 янв 2011 в 19:11

Понял, почитаю — вникну
При поверхностном взгляде думаю, что это относится уже к уровню транспортировки сжатого потока (и его соответствующей упаковки), а не к самому сжатию видеопотока.

DomSecurity 5 янв 2011 в 19:18

Если это относится к сжатию — буду благодарен, если осветите.

Еще интересно описание балансировки между тремя параметрами: битрейт — качество — устойчивость к потерям в канале.

Конкретнее — возможно ли при зафиксированном качестве и битрейте изменять параметры сжатия/избыточности (и какие именно) кодеков H.263 и H.264 (для примера) так, чтобы при большом проценте потерь в канале качество страдало бы минимально.

acmer 5 янв 2011 в 19:26

Это одна из интереснейших тем современности. А создание быстрых декодеров, терпимых к ошибкам — весьма нетривиальное искусство. Я пока сам не могу достаточно компетентно об этом написать. Но могу задать этот вопрос спецам в лаборатории и по наличию времени опубликовать.

XaLBa 5 янв 2011 в 21:24

Вряд ли существует какое-то уникальное решение. Важно, какая задача решается, какой контент, какие задержки допустимы, и кто конечные получатели, а также насколько вероятны ошибки при передаче, и какого рода эти ошибки.

Как что-то более-менее общее можно рассмотреть увеличение частоты ключевых кадров. Ещё советую обратить внимание на опцию --intra-refresh у кодера x264.
Пост разработчика об этом: x264dev.multimedia.cx/archives/249

По идее, должны быть ещё какие-то механизмы добавления информации для восстановления бинарного потока в случае ошибок. Но тут я ничего не знаю.

DomSecurity 5 янв 2011 в 21:52

Формально есть три пути «помехозащищенности» для реалтаймового видеопотока:
1) На уровне транспорта потока — это всякие коды исправляющие ошибки (ECC) — Рида-Соломона, БЧХ и прочее.
2) На уровне формирования RTP пакетов — например, кладем каждый фрейм/GOB/slice в один пакет, чтобы при потере одного пакета не портились соседние «размазанные» GOB/slice.
3) На уровне кодека — уменьшение размера матриц квантования для уменьшения влияния потерь блоков коэффициентов.

Методы 2 и 3 работают для «блочных» кодеков до H.263, а начиная от H.264, где понятие кадра/GOB заменилось NALU, эти методы становятся неэффективными.

Вот мне и интересно было, может чего автор и напишет по этому поводу.

DarkVenomx 5 янв 2011 в 18:57

Спасибо, хорошая статья. Читал и познавал, так сказать)

Ravager 5 янв 2011 в 19:06

Кстати, при показе по американскому телевизору оригинальный поток 24 к/с замедляется на тысячную долю, чтоб потом частоты 3:2 совпали с 59.97 разверткой

acmer 5 янв 2011 в 19:08

Я об этом писал

Ravager 5 янв 2011 в 19:15

ой и правда, прочитал между строк…

pro100tak 5 янв 2011 в 19:20

белка жжот — пара скриншотов, а какая популярность :)

Dim0FF 5 янв 2011 в 19:37

Белка, кстати, кажется из Big Buck Bunny.

А мультфильм рекомендую посмотреть, тем более он бесплатный.

Balansse 5 янв 2011 в 19:29

Открою секрет: 23.976 = 24/1.001, а 29.97 = 30/1.001, то есть в стандарт американского телевещания NTSC заложен делитель 1.001. Соответственно при показе киноленты произойдет совсем небольшое замедление, которое не будет заметно зрителю, но если это музыкальный концерт, то скорость показа настолько критична, что лучше изредка пропускать кадры и опять же зритель ничего не заметит

А причина, по которой ввели этот делитель? Ждал объяснения, а тут БАЦ и оборвалось. Также не очень понял пример с музыкальным концертом — скорость критична, но все равно зритель не заметит?
Справедливо только для американского NTSC?

acmer 5 янв 2011 в 19:43

Насчет причины введения делителя однозначного мнения нет, но наиболее реалистичной кажется то что: в электросети США ровно 60 Гц, а старые телевизоры «моргали» в такт электросети, то частота смены кадров немного снижена для смещения синхронизации по времени. То есть чтобы телевизор не мерцал без конца, а лишь время от времени.
Насчет концерта, то для сохранения скорости выбрасывается часть кадров, но происходит это редко и зритель ничего не замечает.
С европейским PAL все намного хуже, фильмы ускоряют на 4% для европейских DVD. А вот теми же концертами прибегают к болезненным алгоритмам интерполяции частоты кадров. 24 и 25 — уже слишком большая разница, повторы кадров зритель заметит.

Balansse 5 янв 2011 в 19:50

То есть все фильмы ускоряются на 4%, и этого никто не замечает? А к чему эти ускорения — если давно уже отошли от черезстрочной развертки и CRT кинескопов в сторону прогрессивной и LCD? Просто стандарты?

acmer 5 янв 2011 в 19:56

Да — фильмы тупо ускоряются (почти все или замедляются европейские для американцев). Именно поэтому когда к западным блюреям приделывают русские звуковые дорожки с DVD их приходится перекодировать.
А против стандартов в киноиндустрии не попрешь, это сейчас уже Blu-Ray плееру без разницы какой из стандартов читать (но опять же «из стандартов»), а DVD должны быть совместимы с кинескопными телевизорами.

Balansse 5 янв 2011 в 20:05

А как же тогда можно посмотреть фильмы в оригинальной скорости? А то 4% как то грустно.

acmer 5 янв 2011 в 20:08

Можете ускорить в каком-нибудь плеере. А так вам 4% времени экономили.

ValdikSS 5 янв 2011 в 20:28

Это очень слышно на вот этих двух видео:
www.youtube.com/watch?v=1l3HtodpBlU — оригинал
www.youtube.com/watch?v=9HGkSjLENa4 — русская лицензия(ntsc->pal, ускорение 4%)

Dim0FF 5 янв 2011 в 20:47

Я, как любитель аниме, разницу заметил, да и вспомнил заодно сюжет, но вот рядовому пользователю, не увлекающемуся аниме, вы вынесли мозг:)

ValdikSS 5 янв 2011 в 20:52

Почему? Разве на слух не заметно? Там же тембр во втором видео выше из-за ускорения.
_{а почему сейчас сюжет вспомнили, что, suzumiya haruhi no shoushitsu пропустили?}

1amer 6 янв 2011 в 00:28

сразу заметил разницу, хотя ничуть не анимешник.

impass 5 янв 2011 в 21:02

а в чём заключается суть PAL или NTSC применительно к цифровому видеопотоку? разве что-то кроме частоты кадров/развёртки имеет значение?
на современном (цифровом) оборудовании (не беря в расчёт ПК) картинка всё-таки воспроизводится «as is» или непременно с преобразованиями?

acmer 5 янв 2011 в 21:11

PAL и NTSC породили подобные цифровые стандарты.
Ну приводить к 60 fps монитора то придется, все равно преобразование.

impass 5 янв 2011 в 21:12

а где сказано, что у каждого экрана — 60 fps? :)

acmer 5 янв 2011 в 21:16

Не у каждого, но у большинства так.

gene4000 7 янв 2011 в 09:58

Наверное «у большинства ЖК».
ЭЛТ работают на разных частотах, и могут переключаться в довольно широких пределех.
И, да, ими все еще пользуются. Пока цена/качество для ЖК не станет человечной.

merlin-vrn 5 янв 2011 в 21:33

Вообще в ntsc и pal существенно по-разному кодируется изображение именно при радиопередаче, в особенности цвет. В ntsc вообще там очень красивая математика, которая на практике, однако, показала свои проблемы и возникла получили расшифровку nevet the same color.

В цифровом различаются во-первых размеры растра по вертикали (для PAL это 288 или 576 и для NTSC — 240 и 480). Это пришло из радиостандартов: PAL-625 строк, NTSC-525 строк, при этом видимых соответственно 575 и 479, и экран начинается с полу-строки (ну т.е. со строки, которая содержит изображение начиная с середины) и такой же полу-строкой заканчивается.
Во-вторых различается частота кадров: для PAL допустима частота 25, для NTSC — 27.97.
Другие различия уже чисто цифровые: скажем, некоторые типы pulldown не получится сделать в «чужом» стандарте, (типа 3:2, который переводит фильмы 24fps->30fps, и который имеет смысл только для PAL). На самом деле, это даже не ограничение формата, а ограничения логики кодировщика: какой-то определённый pulldown не указывается, а в потоке ставятся флаги: «поле закодировано непосредственно» или «поле является повторением другого поля», в результате чего для 3:2 фактически кодируется 24 кадра в секунду, а «добавление кадров» до 30 происходит непосредственно при распаковке потока.

С появлением HD разница полностью устранена — там нет понятий «PAL» или «NTSC». Стандарты просто описываются названием профиля: разрешение картинки, частота кадров и тип потока (кадры/поля). Разнообразные соотношения сторон, которые были раньше, тоже ушли в небытие: все HD-стандарты — 16:9

acmer 5 янв 2011 в 21:39

Есть ошибки:
29.97, а не 27.97
3:2 pulldown имеет отношение только к NTSC а не к PAL как вы написали
и пулдаун не всегда делается флагами в потоке, чаще это делают ДО кодирования.

merlin-vrn 5 янв 2011 в 21:54

Мда, про 3:2 для PAL — это я просто ошибся, имелось ввиду как раз «не имеет смысла для PAL»

Про «пулдаун до кодирования» — не понял, что не так? Материал вообще смешаный film/video бывает, там половину фильма флаги есть, половину — флагов нет, и как их расставить — задача кодировщика, т.е. они на этапе кодирования расставляются.

acmer 5 янв 2011 в 22:05

Не совсем. Есть два случая:
1) Кодируется 29.97 в чересстрочной разверткой и флагами показывается где уже поработал 3:2 pulldown. а где нет. А рендер в тех местах вернет обратно 23.976 и покажет все идеально, а где «чистые» 29.97 уже будет работать деинтерлейсер и качество снизится.
2) Кодируется 23.976, но флагами говорим что надо показать 29.97. Когда-то применялось на DVD.

merlin-vrn 5 янв 2011 в 22:19

Я ни разу не видел проигрывателя, которые бы для «смешанных» видео рисовал бы 23.976 для мест, где были флаги («film») и 29.97 там, где их не было («video»).
По-моему все честно получают 29.97fps-поток, возможно, с повторяющимися полями и его уже стараются показать. Если показывают на экране компа — абсолютно весь поток деинтерлейсится, даже в тех местах, где в принципе изначально это film.

Tird 5 янв 2011 в 21:12

А я когда заметил, что по телеку фильмы идут с повышенной скоростью, думал что они это делают, для экономии эфирного времени (впихивания больше рекламы). А оно вон как оказывается.

А почему на блюреях, если им уже без разницы, используется 23.976 fps, а не 24?

acmer 5 янв 2011 в 21:19

На блюрее можно использовать 24. Обычно мастер-запись звука берут тупо ту что для американского DVD и все)) Но например видел фильмы IMAX на BD, где ровно 24.

НЛО прилетело и опубликовало эту надпись здесь

crazywebdev 6 янв 2011 в 14:53

Отставить задорновщину!

НЛО прилетело и опубликовало эту надпись здесь

Aux 6 янв 2011 в 14:02

Дело не в черезстрочной развёртке, а в том, что у вас экран работает с одной частотой, а видео-поток идёт с другой. Из-за этого разные кадры проводят разное количество времени на экране. В итоге вместо плавной картинки видно дёрганное изображение. Я когда смотрю кино на компе, то у меня reclock ускоряет видео аж до 30 кадров в секунду, потому как дёрганую картинку мне смотреть неприятно.

DEHiCKA 5 янв 2011 в 20:41

Частота сети здесь не причем.
30/1.001 был введён при внедрении цвета в NTSC для уменьшения влияния несущей звука на цветовую поднесущую.

acmer 5 янв 2011 в 20:49

Вполне возможно. Просто документально причина нигде не закреплена.

DEHiCKA 5 янв 2011 в 21:00

В стандарте конечно не написано «зачем», но это однозначный факт. Просто вы видимо с анологовым видео мало общались.

impass 5 янв 2011 в 20:54

выходит, вся эта чехарда с различной частотой кадров — лишь ради совместимости с какой-то древней ЭЛТ техникой? вроде бы уже на цифровое ТВ в США переходят повсеместно, и всё равно…
25 кадров/с в Европе сугубо по той же причине применяется, из-за 50 Гц электросети?

acmer 5 янв 2011 в 21:02

Вот 25 кадров точно из-за электросети.
Но вот отснятые материалы уже никуда не денешь => стандарты не стали менять, просто современные железки показывают и то и другое.

gene4000 7 янв 2011 в 10:01

ЭЛТ мониторы работают с широким диапазоном частоты. Как раз в отличие от ЖК, у которых она обычно фиксирована.

dordzhiev 5 янв 2011 в 19:36

Спасибо автору, не знал про цвета, прям глаза открыли :)

dasty 5 янв 2011 в 23:06

Ага, я тоже думал что ч\б телевизор просто показывает то что ловит, а кинескоп не может цвета показать )

eugenets 5 янв 2011 в 19:56

Спасибо. Отдельные вещи знал, но кое-что новое подчерпнул, да и вообще здорово увидеть все собранным в одном месте и структурированным.
Насколько я помню, с арифметическим кодированием есть какие-то проблемы с лицензией, поэтому и используется хаффман.

acmer 5 янв 2011 в 19:57

Уже нет. Патент истек))

eugenets 5 янв 2011 в 20:09

Тогда, видимо, по привычке :)
А давно истек? Может просто еще не успели реализовать?

acmer 5 янв 2011 в 20:32

Когда истекли не знаю. Но все патенты IBM уже истекли, остался только один патент компании Ricoh www.google.com/patents?vid=5272478
Но нынешние реализации его не нарушают.

Vigilait 5 янв 2011 в 20:08

Спасибо, некоторые вещи знал, но далеко не все. Жду продолжения!

Mairon 5 янв 2011 в 20:11

Небольшой вопрос по поводу подсчётов, никак не могу сообразить:

1920*1080*24*24 = 1139 Мегабит/с, а если захотим записать 90 минутный фильм, то потребуется 90*60*1139 = 750 Гигабайт!

В исходных данных у нас мегабиты, а в результате уже гигабайты. Можно небольшой ликбез по переводу этих величин? А то помню со школы, что 1 байт=8 бит, но как тут получилось, никак не соображу =/

Dim0FF 5 янв 2011 в 20:20

(1139 мбит / 8) * 90 мин *60 сек = 768825 Мб / 1024 = 751 Гб

Mairon 5 янв 2011 в 20:21

Спасибо, переглючило.

acmer 5 янв 2011 в 20:20

Я опустил переводы величин:
90*60*1139 = {МБит/с * сек = МБит} = 6150600 МБит = {/8} = 768825 Мбайт = {/1024} = 750.8 Гигабайт.

Mairon 5 янв 2011 в 20:22

Да, спасибо, я тупанул.

pxx 6 янв 2011 в 14:37

Наверное зря опустил ибо выглядит как ошибка. Я тоже заметил это несоответствие и хотел обратить внимание в комментариях.

braintorch 5 янв 2011 в 20:20

Спасибо, неплохая статья. Напишите ещё про анаморфный пиксель и переменную частоту кадров.

acmer 5 янв 2011 в 20:27

Про анаморфный пиксель ничего особо интересного нет: прямоугольный он и в африке прямоугольный, кодек это не волнует, это уже забота устройства отображения.
Переменная частота кадров — зло. Но она полезна в системах видеонаблюдения. Кодек тоже не сильно частота кадров беспокоит, а вот рендеру с ней работать тяжело. Смысл в том что стоит камера, снимает в ночное время, снимает еще и шумы, а они меняются с течением времени, а других изменений нет => нет и смысла хранить кадры в которых только меняется шум, лишь будут место занимать.

impass 5 янв 2011 в 20:46

нет и смысла хранить кадры в которых только меняется шум, лишь будут место занимать

не для этого ли в большинстве систем видеонаблюдения применяются те или иные алгоритмы motion detection? нет существенного изменения — новые кадры не сохраняются

acmer 5 янв 2011 в 20:47

Они и есть — отсюда переменная частота кадров.

kiri4 5 янв 2011 в 20:27

У нас в университете как раз был курс лекций по обработке видеосигналов, который читал Красильников Н.Н., один из прорадителей цифрового телевидения у нас. За статью спасибо, вспомнил былые годы…

ForestQ 5 янв 2011 в 20:31

acmer, вот подскажи. какие проги для конвертации умеют жать с 23.976 до 25 путем убыстрения видео? нашел в procoder'e фильтр pulldown, но сам прокодер очень медленно жмёт. Хотелось бы знать, какие галки в xilisoft video cobverter или mediacoder поставить надо. спс

merlin-vrn 5 янв 2011 в 21:43

Во-первых и в основных — зачем это вам частоту кадров менять? Это совершенно ненормальная задача, могла бы возникнуть только при редактировании видео, а при просмотре вообще-то совершенно пофигу, какая там частота кадров.

То есть, если вы просто поменять её хотите, ничего перекодировать не надо — надо взять и поменять флаг, указывающий на частоту кадров. Это можно сделать в проге ReStream, если речь о MPEG-файле или же в VirtualDubе, если речь об AVI. Для других форматов можно попробовать тот же VirtualDub, если он сможет, или virtualdubmod.
В любом случае, придётся самостоятельно чуть ускорить звук и подменить дорожку.

Да, и фильтр pulldown скорее всего делает совершенно другое. Он либо просто ставит периодически флажки в выходном файле, чтобы декодер показывал некоторые поля по два раза (так кодируется 24 кадра в сек, а показывается 30), либо он ещё перед этим сканирует поток, находит одинаковые поля и уже ставит флажки в зависимости от найденного (применяется для смешанного материала film/video, когда идёт то фильм-материал, для которого имеет смысл pulldown, то видео-материал, для которого pulldown смысла не имеет).

ForestQ 5 янв 2011 в 21:53

тут дело такое. у меня железка видит исключительно mpeg2 pal и никак иначе. приходиться всякие сериалы кодить с mpeg4 23.976.

merlin-vrn 5 янв 2011 в 22:08

Ну, вам не повезло с железкой :(

Но тут в любом случае перекодировать… Только вот автомат с ходу назвать затруднюсь. Точно могу сказать, что никакой pulldown не нужен.

Я кодировал видео для DVD при помощи HCenc или CinemaCraft Encoder SP. Это не самый тривиальный подход, но кодировщики эти очень быстрые.
HCenc бесплатный, но от вас потребуется AviSynth — он видео умеет брать только из него.

Звуковую дорожку готовить так: распаковать, ускорить в любом редакторе (хоть audacity) в 25*1.001/24 = 1.042708(3) раза и запаковать в mpeg1 layer2 (при помощи twolame) либо в ac3 (при помощи besweet, например).

Потом муксером собрать видео и аудио в програмный поток.

ForestQ 5 янв 2011 в 22:24

эх. радикально. а на какие контрольные фразы обращать внимание, копаясь в настройках «автоматов» нужно? pulldown отмели, как я понял.

merlin-vrn 5 янв 2011 в 22:33

Вы DVD-подобный (совместимый) поток хотите в итоге сделать, или железка играет любой pal mpeg2?

merlin-vrn 5 янв 2011 в 22:38

В общем, для PAL DVD — делайте размер картинки 720x576, ограничивайте битрейт видео 9800kbps (и на звук надо оставить, чтобы в сумме было не более 10000kbps); ещё нужно выставить правильное соотношение сторон картинки, на DVD допустимы 4:3 и 16:9. Вообще, часто есть пресет «DVD» — выбирайте его и не морочьте себе голову.

ForestQ 5 янв 2011 в 22:46

так при таком раскладе получаются рывки, раз в секунду, т.к. 25-23.976 — в это время кодер вставляет предыдущий кадр, насколько я понимаю. вот и хочется убыстрить все видео, чтобы оно было без рывков.

merlin-vrn 5 янв 2011 в 22:55

В общем, я боюсь, для такой задачи готового автомата нет. Ваш вот автомат — больно умный, кадры вставляет. Да и звук вам по-любому отдельно обрабатывать.

Если исходные файлы — avi, наиболее простой будет такая последовательность действий:
VirtualDubом открываем файл, делаем Audio->Save WAV.
Этот WAV подправляем в редакторе, ускоряем. Кстати, звук должен быть в итоге 48000 Гц для DVD.
в VirtualDubе ставим «брать звук из WAV», а в Video — меняем частоту кадров на 25 и ставим direct stream copy, после чего сохраняем всё как avi — это будет промежуточный файл.

Его уже скармливаем вашему автомату.

tesin 5 янв 2011 в 20:34

1920*1080*24*24*5400/8 = 806 215 680 000 байт ~ 750ГБ

tesin 5 янв 2011 в 20:35

извиняюсь, ответ был для Mairon

Mairon 5 янв 2011 в 20:38

Сдаюсь уже, сдаюсь =)

+11

alklim 5 янв 2011 в 20:53

Когда-то давно меня занимала мысль реализовать видеокодек путем разложения каждой линии кадра в ряд Фурье с сохранением коэффициентов гармоник. Смысл примерно тот же как и в стандартных кодеках — соседние кадры как правило очень похоже и сохранять можно изменяющиеся коэффициенты гармоник.
Но индустрия и без меня справилась и умудряется запихнуть 1080р фильм в 10-15 ГБ!

Хотя я бы с удовольствием почитал про предложенный метод, если его кто-то пытался делать.
Автору топика известны работы в этой области?

m1el 5 янв 2011 в 21:06

> Хотя я бы с удовольствием почитал про предложенный метод, если его кто-то пытался делать.
> Автору топика известны работы в этой области?
ШТО? Поставим вопрос так: кто из разработчиков всех действующих кодеков НЕ проводил работы в этой области?

m1el 5 янв 2011 в 21:12

Простите, невнимательно прочел комментарий.

acmer 5 янв 2011 в 21:08

Эта область сейчас занята немного другими делами, я именно — 3D
Поэтому и проект интела по применению вейвлетов (про них я знаю очень мало) к видео почти не движется. H.264 очень хорошо справляется с поставленной задачей, но с 3D пока у него проблемы.
А приведенный в статье метод (естественно более сложный) реализован в XviD

DomSecurity 5 янв 2011 в 21:58

Касательно вейвлетов — уже лет как 5 существуют быстрые и тупые вйевлет-кодеки для видеоконференцсвязи. Они дают хреновое качество, но быстры, просты и часто используются в локальных сетях.

acmer 5 янв 2011 в 22:08

Вот вейвлеты — очень вычислительно жадные. Да они используются, но на оочень маленьких битрейтах (с очень херовым качеством), потому что иначе уже никак. Но по сравнению с обычными кодеками быстротой они не отличаются.

Sakura 5 янв 2011 в 21:10

Вау, очень познавательно )
Хоть и болван в математике, но общая теория очень понравилась.
Жду продолжение, спасибо

egorinsk 5 янв 2011 в 21:15

О! Отличная тема! Автор, подскажите пожалуйста, а если бы я допустим хотел провести тесты разных кодеков по сжатию видео, как лучше всего посчитать (автоматически) уровень потерь качества? не отсматривать же вручную десятки видеороликов. Мне пока в голову приходит только брать какие-то кадры и посчитать сумму разностей между пикселями на них.

И есть ли где-то сравнительные таблицы кодеков, каким лучше сжимать, каким хуже?

dbf 5 янв 2011 в 21:20

Надо использовать compression.ru/video/quality_measure/video_measurement_tool_en.html

acmer 5 янв 2011 в 21:22

compression.ru/video/codec_comparison/h264_2010/
Сравнение делали в МГУ.

amarao 5 янв 2011 в 21:56

У вас лицензия в статьях в Википедии кривая. Почему вы передаёте в PD кадры из cc-by-sa произведения?

Во-первых, вам не следует писать «собственная работа», а следует писать «производное от title, copyright by someone, original license cc-by-sa»
Во-вторых, саму лицензию следует выбрать из семейства cc.

acmer 5 янв 2011 в 22:12

Пусть с этим разбираются патрулирующие википедию, они лицензии лучше знают. Мне они претензии не предъявляли, хотя статья проверена.

amarao 5 янв 2011 в 22:17

Неправильный подход. «Пускай с этим разбирается редактор и корректор» — это можно сказать в обычном издании. В Википедии с большой вероятностью просто удалят вашу картинку из-за нарушений cc-by-sa лицензии оригинала. То есть сначала там повесят табличку о несоответствии лицензии, напишут вам, а потом удалят.

Кстати, в самой статье у вас стиль довольно сильно хромает.

qmax 6 янв 2011 в 03:51

в этой серии было бы ещё уместно рассказать о структуре самих потоков, форматов контейнеров,
принципиальных различиях ts/ps, с выбором которых всем приходится сталкиваться в первую очередь.