Комментарии 15
Спасибо за статью!
Дело не в картинках и геометрии. Дело в том, что не все «хаосы» фрактальны. Фрактальным он становится когда на систему действуют в течении (продолжительного) времени однородные силы (например для биржевых котировок теория хаоса очень хорошо работает). «Полезный» сигнал в аудиозаписи этому условию уже при первом приближении не удовлетворяет. Система конечно, динамическая и всё такое, но не фрактальная, потому что даже вряд ли хаос. Сжатие с потерями всегда достигается (спектральное через Фурье или еще какое другое) при наличии предположений о полезной информации, что противоречит подходу к хаотичным системам.
Но лично мне идея фрактального сжатия как таковой кажется притянутой за уши ещё с начала её появления и представляется своего рода «Святым Граалем». Ведь со времени выхода «Фрактальной геометрии природы» ничего особо нового так и не появилось
Дело не в картинках и геометрии. Дело в том, что не все «хаосы» фрактальны. Фрактальным он становится когда на систему действуют в течении (продолжительного) времени однородные силы (например для биржевых котировок теория хаоса очень хорошо работает). «Полезный» сигнал в аудиозаписи этому условию уже при первом приближении не удовлетворяет. Система конечно, динамическая и всё такое, но не фрактальная, потому что даже вряд ли хаос. Сжатие с потерями всегда достигается (спектральное через Фурье или еще какое другое) при наличии предположений о полезной информации, что противоречит подходу к хаотичным системам.
Интересная публикация. Возможно, часть искажений являются результатами ошибок в коде. Но по поводу «аудио-фракталов» несоглашусь. В этом случае нужно определить, что значит «аудио» — психо-физиологическое восприятие изменение давления воздух, созданное акустической системой под воздействием цифро-аналогового преобразования массива байтов, интерпетируемого как множество выборок аудио потока. Фрактальные преобразования могут апроксимировать множества при услови дробности пространства. Дробность пространства определяется операциями над множествами — в случае кода это операция усреднения над данными в double типе — эта операция дробления пространства между элементами множества, так-как уменьшает расстояние между элементами множества(если расстояние между элементами было четыре элемента, то в результате оно станет равным двум элементам.). Таким образом, не существует особых «аудио-фракталов». Существуют только множества семплов, которые можно апроксимировать фрактальными преобразованиями, если поместить их в дробное пространство.
Идея оригинальной статьи является попытка инженерного исследования возможности применения математических принципов, в корне отличающихся от принципов, положенных в основу известных форматов сжатия аудио данных: апроксимацией ортогональными рядами (Дискретно-Косинусные Преобразования) и линейными предсказаниями.
Идея оригинальной статьи является попытка инженерного исследования возможности применения математических принципов, в корне отличающихся от принципов, положенных в основу известных форматов сжатия аудио данных: апроксимацией ортогональными рядами (Дискретно-Косинусные Преобразования) и линейными предсказаниями.
Дробность пространства определяется операциями над множествами
Вообще-то изначально, дробность пространства фракталов не означает ничего интересного вообще. Суть такова: берём фрактал состоящий из линии — размерность 1, поскольку это «линия», потом начинаем эту линию корёжить, собственно, строя сам фрактал, получается загогулина. Ну а поскольку корёжить можно до бесконечности и она становится всё пушистей и пушистей, то в пределе можно говорить о том, что будет заполненны все промежутки между близкими линиями и получится уже не линия, а фигура обладающая площадью. Потом следуют какие-то красивые слова «бла-бла-бла», дробная размерность фрактала 1.9 приехали мы почти что двухмерная фигура.
На мой взгляд, для описания линии как фрактала более подходяще "Канторова пыль (множество)", но хотел бы уточнить, что вы имеете в виду под
размерность 1
В чём измеряется эта размерность? В случае усреднения семплов это понятно — было четыре семпла с максимальным расстоянием в три семпла и минимальным ноль семплов, после усреднения получили максимальное расстояние в один семпл и минимальным ноль семплов. В этом случае семпл есть мера расстояния и размерность определяется совокупностью всех семплов во множестве.
Фрактальные преобразования могут апроксимировать множества при услови дробности пространства. Дробность пространства определяется операциями над множествами — в случае кода это операция усреднения над данными в double типе — эта операция дробления пространства между элементами множества, так-как уменьшает расстояние между элементами множества(если расстояние между элементами было четыре элемента, то в результате оно станет равным двум элементам.). Таким образом, не существует особых «аудио-фракталов». Существуют только множества семплов, которые можно апроксимировать фрактальными преобразованиями, если поместить их в дробное пространство.
«Вон оно чо, Михалыч». Что-то в этом есть. Давайте будем разбираться. «Фрактальные преобразования могут аппроксимировать множества»… — да, могут. «При условии дробности пространства». Дело не в дробности пространства. Дробность пространства разве гарантирует фрактальность (если ехать в обратную сторону)? Неясно, именно то деление, что делает усреднение double, вообще фрактально ли…
Refridgerator, вы молодец! Шикарная статья, именно такими и должны быть научные статьи. Интересно, когда-нибудь для получения научного звания будут учитываться статьи опубликованные на хабре? У меня до недавнего времени почта была просто завалена предложениями опубликоваться, подозреваю, что большинство не то что не рецензируется, но даже и не читается.
+22 у статьи, все что нужно знать о ценителях...
Да, шикарно, человек разрабатывает и реализует алгоритм — и это «плохая и неаучная статья», а потом приходит Белинский, прогоняет готовый алгоритм на тривиальных тестовых данных, смотрит спектр и заключает — «фигня» :) Вот это уровень, да. Какая заслуга перед [s]отечеством[/s] сообществом!.. Понятно, что автор реализации алгоритма не лишен понтов и склонности к громким заявлениям (Стивена Вольфрама вспомните), но ведь он написал принципиально отличающуюся от всего имеющегося реализацию, и то, что она вообще хоть как-то работает, уже хорошо. А через полгода выяснится, что этот алгоритм, к примеру, лучше всех жмет данные с датчиков уровня воды при волнении (в силу фрактальной природы волн), и найдет свое применение. А Белинские и прочие критики/рецензенты канут в лето :)
Человек не придумал ничего нового. Он прикрутил квадратное колесо к телеге, о чем и написано в этой статье. Жмёт хуже почти любого аналога, потери качества астрономические, Refridgerator в комментариях предоставил ссылку на звуки сжатые этим алгоритмом.
Вы вот просто подумали, что автор обсуждаемого алгоритма придумал что-то полезное, а другой человек решит потратить годы своей жизни чтобы улучшить его. И только благодаря такой статье как эта, будет спасено несколько лет человеческой жизни. Очевидно же, что алгоритм тупиковый. С тем же успехом можно уменьшить сэмплирование wav файла, а потом интерполировать значения между сэмплами чтобы «восстановить» исходный звук. Я вас уверяю, что сжатие будет сильнее, а качество результирующего звука выше, чем в предложенном алгоритме.
Вы вот просто подумали, что автор обсуждаемого алгоритма придумал что-то полезное, а другой человек решит потратить годы своей жизни чтобы улучшить его. И только благодаря такой статье как эта, будет спасено несколько лет человеческой жизни. Очевидно же, что алгоритм тупиковый. С тем же успехом можно уменьшить сэмплирование wav файла, а потом интерполировать значения между сэмплами чтобы «восстановить» исходный звук. Я вас уверяю, что сжатие будет сильнее, а качество результирующего звука выше, чем в предложенном алгоритме.
Поставил минус. Да, кодек искажает. Статья показывает, как именно он искажает тестовые сигналы. Но в контексте объективных испытаний аудиокодека это просто неправильная постановка задачи.
Правильная постановка: заметит ли человек искажения при данных параметрах кодека на тех звуках, для сжатия которых изначально предназначен кодек? Или, если кодек изначально позиционируется как универсальный, то отдельно нужен ответ для речи и отдельно для музыки.
Для объективной и автоматизируемой (т.е. не требующей участия человека) оценки заметности искажений служат различные психоакустические модели.
Правильная постановка: заметит ли человек искажения при данных параметрах кодека на тех звуках, для сжатия которых изначально предназначен кодек? Или, если кодек изначально позиционируется как универсальный, то отдельно нужен ответ для речи и отдельно для музыки.
Для объективной и автоматизируемой (т.е. не требующей участия человека) оценки заметности искажений служат различные психоакустические модели.
1. Хотите послушать — пожалуйста.
2. Все эти сигналы имеют непосредственное отношение к музыке. Чистые тона — основа электронной музыки. Логарифмические свип-тона можно услышать у Jean Michel Jarre в Oxygen II. Также существуют стили музыки (например, Нойз) в которых шуму отводится первоочередное значение.
2. Все эти сигналы имеют непосредственное отношение к музыке. Чистые тона — основа электронной музыки. Логарифмические свип-тона можно услышать у Jean Michel Jarre в Oxygen II. Также существуют стили музыки (например, Нойз) в которых шуму отводится первоочередное значение.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Анализ аудио-кодека ROAD