Как стать автором
Обновить

Комментарии 11

>r128gain измеряет громкость аудио файлов

Громкость файла это не цифра, а стрим, что именно это программа дает на выходе?

громкость в единицах измерения LUFS

прога просто анализирует весь файл, потом запускает соответствующие утилиты (sox/ffmpeg) с нужными параметрами без всяких стримов.
Можно было обойтись только ffmpeg:
1) использовать аудиофильтр ebur128, чтобы замерить громкость
2) вторым проходом использовать аудиофильтр volume, чтобы изменить громкость. Заодно выбросить информацию о replaygain, если она есть

Плюс этого подхода в том, что не нужны лишние программы, и более корректно будут кодироваться немножко битые файлы (у которых аудио и видео начинаются не одновременно).

Еще есть аудиофильтр loudnorm, который за один проход динамически подстраивает громкость до заданного результата.

Опция -aspect случаем не корежит файлы, которые изначально были с неквадратным пикселом (PAR != 1/1)? Есть подозрение, что будет корежить.

Стандарты — это хорошо, но использовать в 2016 году mpeg2 (с битрейтом 30Мб/с для SD видео!) и mp2 — это как-то… нестандартно.

да, мне представляется избыточным выражение


-s pal -r pal -aspect 4:3 -vf scale=720:-1,pad=720:576:(ow-iw)/2:(oh-ih)/2

корежение предотвращается выражением


-vf scale=720:-1,pad=720:576:(ow-iw)/2:(oh-ih)/2

Спасибо за подсказки с фильтрами, попробую.


проект r128gain больше не развивается, думаю переходить на bs1770gain от того же автора, который в данный момент является бетой, судя по latest версии.
Резонность использования утилиты r128gain мне представляется по главной причине: эта утилита специализирована именно для измерения и только для измерения громкости по методике R128-2011, которая нормирована нашим регулятором.
r128gain проверена и используется профессиональными студиями.
r128gain проверена мной и результат меня устраивает, а главное — устраивает регулятора.


по поводу стандартов — разрешите не обсуждать.
Спасибо за комментарий.

И все-таки корежит. Проверить просто — берем любой нормальный файл и конвертируем его в пару тестовых файлов. Один раз используя -s 720x288, один раз используя -s 360x576. Получаем два файла с дикими значениями SAR, но тем же DAR, что был в исходном файле. Любой нормальный плеер их отыграет с нормальной картинкой. А после перегона вашей комбинацией фильтров — получится жестокое искажение. Это потому, что ваша комбинация фильтров просто-напросто игнорирует исходное значение SAR/DAR, считая, что исходный SAR был 16:15. Более правильно так: -aspect 4:3 -vf «scale=min(576*15*sar*iw/ih/16\,720):min(720*16*ih/15/sar/iw\,576),pad=720:576:(ow-iw)/2:(oh-ih)/2». Здесь scale приводит SAR к 16:15 и одновременно вписывает картинку в 720x576.

Что касается стандартов, то и r128gain, и af=ebur128 (своя внутренняя реализация) и af=loudnorm (использует libebur128) реализуют стандарт R128; возможно, более старую ревизию, чем 11 года… Но если учитываются требования регулятора, то это серьезный довод в пользу именно вашего решения по измерению.

Кармы моей на Вас не хватает!
Вы внесли большой вклад.


Оформим для читателей.


-aspect 4:3 -vf "scale=min(576*15*sar*iw/ih/16\,720):min(720*16*ih/15/sar/iw\,576),pad=720:576:(ow-iw)/2:(oh-ih)/2"

Спасибо!

а, или отталкиваться от количества строк, что, возможно, более правильно и сильно короче и понятнее.


-aspect 4:3 -vf scale=-1:576,pad=720:576:(ow-iw)/2:(oh-ih)/2

В статью пока внес правки из Вашего комментария.

А разница? Такой вариант тоже искажает картинку. Для большинства входного контента SAR либо 16:15, либо 1:1, так что искажение обычно малозаметно на глаз; но если попадется какой-нибудь нестандартный контент, то будут проблемы

30Мб/с — предельный битрейт. Фактически на выходе он не превышает в среднем 6Мб/с

Еще замечание по аудио фильтрам


  • af=ebur128
  • af=loudnorm

Эти фильтры очень хороши для проведения прямого эфира и у мня уже появились туманные идеи применения.
Однако, использовать их относительно контента потенциально опасно: они искажают звуковую картину, являясь динамическими.


Применительно к контенту, необходимо изменять общую громкость дорожки, не касаясь относительной частотной разности.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации