Refridgerator Sep 24 2016 at 14:00

Анализ аудио-кодека ROAD

6 min

Algorithms*

From sandbox

+48

Comments 15

S_A Sep 24 2016 at 15:07

Спасибо за статью!

Но лично мне идея фрактального сжатия как таковой кажется притянутой за уши ещё с начала её появления и представляется своего рода «Святым Граалем». Ведь со времени выхода «Фрактальной геометрии природы» ничего особо нового так и не появилось

Дело не в картинках и геометрии. Дело в том, что не все «хаосы» фрактальны. Фрактальным он становится когда на систему действуют в течении (продолжительного) времени однородные силы (например для биржевых котировок теория хаоса очень хорошо работает). «Полезный» сигнал в аудиозаписи этому условию уже при первом приближении не удовлетворяет. Система конечно, динамическая и всё такое, но не фрактальная, потому что даже вряд ли хаос. Сжатие с потерями всегда достигается (спектральное через Фурье или еще какое другое) при наличии предположений о полезной информации, что противоречит подходу к хаотичным системам.

Xirexel Sep 24 2016 at 15:27

В данном случае «хаос» предполагает чуствительность к отклонениям, а фрактальные преобразования обладают такой чуствительностью в связи с их рекурсивной природой.

Xirexel Sep 24 2016 at 15:23

Интересная публикация. Возможно, часть искажений являются результатами ошибок в коде. Но по поводу «аудио-фракталов» несоглашусь. В этом случае нужно определить, что значит «аудио» — психо-физиологическое восприятие изменение давления воздух, созданное акустической системой под воздействием цифро-аналогового преобразования массива байтов, интерпетируемого как множество выборок аудио потока. Фрактальные преобразования могут апроксимировать множества при услови дробности пространства. Дробность пространства определяется операциями над множествами — в случае кода это операция усреднения над данными в double типе — эта операция дробления пространства между элементами множества, так-как уменьшает расстояние между элементами множества(если расстояние между элементами было четыре элемента, то в результате оно станет равным двум элементам.). Таким образом, не существует особых «аудио-фракталов». Существуют только множества семплов, которые можно апроксимировать фрактальными преобразованиями, если поместить их в дробное пространство.
Идея оригинальной статьи является попытка инженерного исследования возможности применения математических принципов, в корне отличающихся от принципов, положенных в основу известных форматов сжатия аудио данных: апроксимацией ортогональными рядами (Дискретно-Косинусные Преобразования) и линейными предсказаниями.

VaalKIA Sep 24 2016 at 15:34

Дробность пространства определяется операциями над множествами

Вообще-то изначально, дробность пространства фракталов не означает ничего интересного вообще. Суть такова: берём фрактал состоящий из линии — размерность 1, поскольку это «линия», потом начинаем эту линию корёжить, собственно, строя сам фрактал, получается загогулина. Ну а поскольку корёжить можно до бесконечности и она становится всё пушистей и пушистей, то в пределе можно говорить о том, что будет заполненны все промежутки между близкими линиями и получится уже не линия, а фигура обладающая площадью. Потом следуют какие-то красивые слова «бла-бла-бла», дробная размерность фрактала 1.9 приехали мы почти что двухмерная фигура.

Xirexel Sep 24 2016 at 15:58

На мой взгляд, для описания линии как фрактала более подходяще "Канторова пыль (множество)", но хотел бы уточнить, что вы имеете в виду под

размерность 1

В чём измеряется эта размерность? В случае усреднения семплов это понятно — было четыре семпла с максимальным расстоянием в три семпла и минимальным ноль семплов, после усреднения получили максимальное расстояние в один семпл и минимальным ноль семплов. В этом случае семпл есть мера расстояния и размерность определяется совокупностью всех семплов во множестве.

S_A Sep 24 2016 at 19:37

Фрактальные преобразования могут апроксимировать множества при услови дробности пространства. Дробность пространства определяется операциями над множествами — в случае кода это операция усреднения над данными в double типе — эта операция дробления пространства между элементами множества, так-как уменьшает расстояние между элементами множества(если расстояние между элементами было четыре элемента, то в результате оно станет равным двум элементам.). Таким образом, не существует особых «аудио-фракталов». Существуют только множества семплов, которые можно апроксимировать фрактальными преобразованиями, если поместить их в дробное пространство.

«Вон оно чо, Михалыч». Что-то в этом есть. Давайте будем разбираться. «Фрактальные преобразования могут аппроксимировать множества»… — да, могут. «При условии дробности пространства». Дело не в дробности пространства. Дробность пространства разве гарантирует фрактальность (если ехать в обратную сторону)? Неясно, именно то деление, что делает усреднение double, вообще фрактально ли…

Vilyx Sep 24 2016 at 15:50

Refridgerator, вы молодец! Шикарная статья, именно такими и должны быть научные статьи. Интересно, когда-нибудь для получения научного звания будут учитываться статьи опубликованные на хабре? У меня до недавнего времени почта была просто завалена предложениями опубликоваться, подозреваю, что большинство не то что не рецензируется, но даже и не читается.

Alexufo Sep 24 2016 at 21:32

+22 у статьи, все что нужно знать о ценителях...

IIvana Sep 26 2016 at 02:18

Да, шикарно, человек разрабатывает и реализует алгоритм — и это «плохая и неаучная статья», а потом приходит Белинский, прогоняет готовый алгоритм на тривиальных тестовых данных, смотрит спектр и заключает — «фигня» :) Вот это уровень, да. Какая заслуга перед [s]отечеством[/s] сообществом!.. Понятно, что автор реализации алгоритма не лишен понтов и склонности к громким заявлениям (Стивена Вольфрама вспомните), но ведь он написал принципиально отличающуюся от всего имеющегося реализацию, и то, что она вообще хоть как-то работает, уже хорошо. А через полгода выяснится, что этот алгоритм, к примеру, лучше всех жмет данные с датчиков уровня воды при волнении (в силу фрактальной природы волн), и найдет свое применение. А Белинские и прочие критики/рецензенты канут в лето :)

Vilyx Sep 26 2016 at 02:44

Человек не придумал ничего нового. Он прикрутил квадратное колесо к телеге, о чем и написано в этой статье. Жмёт хуже почти любого аналога, потери качества астрономические, Refridgerator в комментариях предоставил ссылку на звуки сжатые этим алгоритмом.
Вы вот просто подумали, что автор обсуждаемого алгоритма придумал что-то полезное, а другой человек решит потратить годы своей жизни чтобы улучшить его. И только благодаря такой статье как эта, будет спасено несколько лет человеческой жизни. Очевидно же, что алгоритм тупиковый. С тем же успехом можно уменьшить сэмплирование wav файла, а потом интерполировать значения между сэмплами чтобы «восстановить» исходный звук. Я вас уверяю, что сжатие будет сильнее, а качество результирующего звука выше, чем в предложенном алгоритме.

AEP Sep 25 2016 at 17:22

Поставил минус. Да, кодек искажает. Статья показывает, как именно он искажает тестовые сигналы. Но в контексте объективных испытаний аудиокодека это просто неправильная постановка задачи.

Правильная постановка: заметит ли человек искажения при данных параметрах кодека на тех звуках, для сжатия которых изначально предназначен кодек? Или, если кодек изначально позиционируется как универсальный, то отдельно нужен ответ для речи и отдельно для музыки.

Для объективной и автоматизируемой (т.е. не требующей участия человека) оценки заметности искажений служат различные психоакустические модели.

-1

Vilyx Sep 25 2016 at 19:26

Поставил вам минус. Да, кодек искажает, да, статья это показывает. Указанный кодек позиционируется как конкурент FLAC по степени сжатия, а это сжатие БЕЗ ПОТЕРЬ.

AEP Sep 25 2016 at 21:46

Цитирую оригинальную статью:

Что вы найдёте здесь:

Краткий обзор применения фрактальных преобразований к задаче сжатия данных с потерями

Vilyx Sep 25 2016 at 23:57

Включите голову, я вам могу ещё десяток таких же бесполезных алгоритмов сжатия с потерями придумать. Сжатие как у FLAC, звук как у MIDI.

Refridgerator Sep 25 2016 at 19:29

1. Хотите послушать — пожалуйста.
2. Все эти сигналы имеют непосредственное отношение к музыке. Чистые тона — основа электронной музыки. Логарифмические свип-тона можно услышать у Jean Michel Jarre в Oxygen II. Также существуют стили музыки (например, Нойз) в которых шуму отводится первоочередное значение.

Show the best of all time