Как стать автором
Обновить

Комментарии 15

Спасибо за статью!

Но лично мне идея фрактального сжатия как таковой кажется притянутой за уши ещё с начала её появления и представляется своего рода «Святым Граалем». Ведь со времени выхода «Фрактальной геометрии природы» ничего особо нового так и не появилось


Дело не в картинках и геометрии. Дело в том, что не все «хаосы» фрактальны. Фрактальным он становится когда на систему действуют в течении (продолжительного) времени однородные силы (например для биржевых котировок теория хаоса очень хорошо работает). «Полезный» сигнал в аудиозаписи этому условию уже при первом приближении не удовлетворяет. Система конечно, динамическая и всё такое, но не фрактальная, потому что даже вряд ли хаос. Сжатие с потерями всегда достигается (спектральное через Фурье или еще какое другое) при наличии предположений о полезной информации, что противоречит подходу к хаотичным системам.
В данном случае «хаос» предполагает чуствительность к отклонениям, а фрактальные преобразования обладают такой чуствительностью в связи с их рекурсивной природой.
Интересная публикация. Возможно, часть искажений являются результатами ошибок в коде. Но по поводу «аудио-фракталов» несоглашусь. В этом случае нужно определить, что значит «аудио» — психо-физиологическое восприятие изменение давления воздух, созданное акустической системой под воздействием цифро-аналогового преобразования массива байтов, интерпетируемого как множество выборок аудио потока. Фрактальные преобразования могут апроксимировать множества при услови дробности пространства. Дробность пространства определяется операциями над множествами — в случае кода это операция усреднения над данными в double типе — эта операция дробления пространства между элементами множества, так-как уменьшает расстояние между элементами множества(если расстояние между элементами было четыре элемента, то в результате оно станет равным двум элементам.). Таким образом, не существует особых «аудио-фракталов». Существуют только множества семплов, которые можно апроксимировать фрактальными преобразованиями, если поместить их в дробное пространство.
Идея оригинальной статьи является попытка инженерного исследования возможности применения математических принципов, в корне отличающихся от принципов, положенных в основу известных форматов сжатия аудио данных: апроксимацией ортогональными рядами (Дискретно-Косинусные Преобразования) и линейными предсказаниями.
Дробность пространства определяется операциями над множествами

Вообще-то изначально, дробность пространства фракталов не означает ничего интересного вообще. Суть такова: берём фрактал состоящий из линии — размерность 1, поскольку это «линия», потом начинаем эту линию корёжить, собственно, строя сам фрактал, получается загогулина. Ну а поскольку корёжить можно до бесконечности и она становится всё пушистей и пушистей, то в пределе можно говорить о том, что будет заполненны все промежутки между близкими линиями и получится уже не линия, а фигура обладающая площадью. Потом следуют какие-то красивые слова «бла-бла-бла», дробная размерность фрактала 1.9 приехали мы почти что двухмерная фигура.

На мой взгляд, для описания линии как фрактала более подходяще "Канторова пыль (множество)", но хотел бы уточнить, что вы имеете в виду под


размерность 1

В чём измеряется эта размерность? В случае усреднения семплов это понятно — было четыре семпла с максимальным расстоянием в три семпла и минимальным ноль семплов, после усреднения получили максимальное расстояние в один семпл и минимальным ноль семплов. В этом случае семпл есть мера расстояния и размерность определяется совокупностью всех семплов во множестве.

Фрактальные преобразования могут апроксимировать множества при услови дробности пространства. Дробность пространства определяется операциями над множествами — в случае кода это операция усреднения над данными в double типе — эта операция дробления пространства между элементами множества, так-как уменьшает расстояние между элементами множества(если расстояние между элементами было четыре элемента, то в результате оно станет равным двум элементам.). Таким образом, не существует особых «аудио-фракталов». Существуют только множества семплов, которые можно апроксимировать фрактальными преобразованиями, если поместить их в дробное пространство.


«Вон оно чо, Михалыч». Что-то в этом есть. Давайте будем разбираться. «Фрактальные преобразования могут аппроксимировать множества»… — да, могут. «При условии дробности пространства». Дело не в дробности пространства. Дробность пространства разве гарантирует фрактальность (если ехать в обратную сторону)? Неясно, именно то деление, что делает усреднение double, вообще фрактально ли…
Refridgerator, вы молодец! Шикарная статья, именно такими и должны быть научные статьи. Интересно, когда-нибудь для получения научного звания будут учитываться статьи опубликованные на хабре? У меня до недавнего времени почта была просто завалена предложениями опубликоваться, подозреваю, что большинство не то что не рецензируется, но даже и не читается.
Да, шикарно, человек разрабатывает и реализует алгоритм — и это «плохая и неаучная статья», а потом приходит Белинский, прогоняет готовый алгоритм на тривиальных тестовых данных, смотрит спектр и заключает — «фигня» :) Вот это уровень, да. Какая заслуга перед [s]отечеством[/s] сообществом!.. Понятно, что автор реализации алгоритма не лишен понтов и склонности к громким заявлениям (Стивена Вольфрама вспомните), но ведь он написал принципиально отличающуюся от всего имеющегося реализацию, и то, что она вообще хоть как-то работает, уже хорошо. А через полгода выяснится, что этот алгоритм, к примеру, лучше всех жмет данные с датчиков уровня воды при волнении (в силу фрактальной природы волн), и найдет свое применение. А Белинские и прочие критики/рецензенты канут в лето :)
Человек не придумал ничего нового. Он прикрутил квадратное колесо к телеге, о чем и написано в этой статье. Жмёт хуже почти любого аналога, потери качества астрономические, Refridgerator в комментариях предоставил ссылку на звуки сжатые этим алгоритмом.
Вы вот просто подумали, что автор обсуждаемого алгоритма придумал что-то полезное, а другой человек решит потратить годы своей жизни чтобы улучшить его. И только благодаря такой статье как эта, будет спасено несколько лет человеческой жизни. Очевидно же, что алгоритм тупиковый. С тем же успехом можно уменьшить сэмплирование wav файла, а потом интерполировать значения между сэмплами чтобы «восстановить» исходный звук. Я вас уверяю, что сжатие будет сильнее, а качество результирующего звука выше, чем в предложенном алгоритме.
Поставил минус. Да, кодек искажает. Статья показывает, как именно он искажает тестовые сигналы. Но в контексте объективных испытаний аудиокодека это просто неправильная постановка задачи.

Правильная постановка: заметит ли человек искажения при данных параметрах кодека на тех звуках, для сжатия которых изначально предназначен кодек? Или, если кодек изначально позиционируется как универсальный, то отдельно нужен ответ для речи и отдельно для музыки.

Для объективной и автоматизируемой (т.е. не требующей участия человека) оценки заметности искажений служат различные психоакустические модели.
Поставил вам минус. Да, кодек искажает, да, статья это показывает. Указанный кодек позиционируется как конкурент FLAC по степени сжатия, а это сжатие БЕЗ ПОТЕРЬ.
Цитирую оригинальную статью:

Что вы найдёте здесь:

Краткий обзор применения фрактальных преобразований к задаче сжатия данных с потерями
Включите голову, я вам могу ещё десяток таких же бесполезных алгоритмов сжатия с потерями придумать. Сжатие как у FLAC, звук как у MIDI.
1. Хотите послушать — пожалуйста.
2. Все эти сигналы имеют непосредственное отношение к музыке. Чистые тона — основа электронной музыки. Логарифмические свип-тона можно услышать у Jean Michel Jarre в Oxygen II. Также существуют стили музыки (например, Нойз) в которых шуму отводится первоочередное значение.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории