Цифровой звук: DSD vs PCM

Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM.

Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал — непрерывная функция, цифровой звуковой сигнал — дискретная функция. Что это значит?

Аналоговый сигнал


Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, — всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).


Рис. 1. Аналоговый сигнал

Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.

Частотный диапазон — набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 — 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора — намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ — прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.


Рис. 2. АЧХ MP3 файла 256 kbps

Динамический диапазон (ДД) — разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку — это 130 дБ — звук взлетающего самолета, а минимальная слышимая громкость — 5… 10 дБ — на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки — 80… 100 дБ.

Искажения – не что иное, как отклонение сигнала от оригинала.

Принципы представления звука в цифровом виде


Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений — это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).


Рис. 3. Преобразование аналогового сигнала в PCM

Два основных параметра качества PCM сигнала — это частота и разрядность. Частота — это количество измерений за одну секунду, чем их больше — тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность — количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов — тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.

Но это не единственный вариант представления звуковой волны в цифровом виде. Есть способ избавиться от такого параметра, как разрядность, оставить только два уровня амплитуды: -100% и +100% (0 или 1). Чтобы добиться этого, не потеряв в качестве, — нужно многократно увеличить частоту считывания величины сигнала (рис. 4).


Рис. 4. Преобразование аналогового сигнала в DSD

Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала — частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.

Восстановление аналогового сигнала из «цифры»


Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, — нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20...22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка. Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.


Рис. 5. Восстановление аналогового сигнала из DSD

Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.

Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».


Рис. 6. Восстановление аналогового сигнала из PCM

Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.

Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.

Применение PCM и DSD, достоинства/недостатки


Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF — это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?

В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.

  1. Первое преимущество, которое любят приводить сторонники DSD, довольно расплывчатое — помехоустойчивость и снижение влияния ошибок. Странно слышать про разную помехоустойчивость в цифровом мире: оба формата подвержены помехам ровно настолько, насколько подвержена помехам книжка в цифровом формате. Длительность хранения любого цифрового формата или качество передачи его между устройствами зависят только от носителя / способа передачи, но не от самого формата. Итак, помехоустойчивость одинаковая. А что по поводу снижения влияния ошибок? Допустим, мы храним 2 альбома на оптических дисках (один PCM, другой DSD), что будет, если диск поцарапать? При чтении поврежденного носителя будут возникать ошибки, но насколько они критичны? В PCM кодировании используются многоразрядные числа, ошибка в старшем разряде очень критична (как пример, разница между десятичными числами 11 и 91): на слух это будет ощущаться, как щелчок. В DSD кодировании один бит информации имеет небольшой вес в общем потоке, нечастые ошибки будут вызывать лишь повышение фонового шума, что на слух будет менее заметно.
  2. Второе преимущество описывается чуть конкретнее: больший динамический диапазон по сравнению с PCM. Что же, и здесь есть некоторое лукавство, ДД больше лишь по сравнению с классическим CDDA форматом: 120 … 140 дБ против 96 дБ. Если же сравнивать, например, с DVD Audio — ДД примерно одинаков.
  3. Третье преимущество: DSD более прост технически. Вот здесь поспорить не с чем: более простое декодирование сигнала, отсутствие необходимости синхронизации и буферизации потока при передаче сигнала с одного устройства на другое — полная победа DSD. Кстати говоря, на фоне этого преимущества странно видеть заоблачные цены на аппаратуру, поддерживающую воспроизведение DSD.
  4. Ну и ещё одно преимущество, которое любят приводить фанаты DSD: музыка в этом формате наиболее близка к оригинальному аналоговому звуку. Аргументируется это тем, что современные аналогово-цифровые преобразователи (АЦП) — работают на принципе дельта-сигма модуляции, то есть эти АЦП выдают цифровой DSD поток. И вот опять лукавство: запись будет полностью оригинальной только в случае прямой записи живого выступления либо при оцифровке готовой аналоговой записи с качественного носителя. Операции сведения, наложения эффектов, мастеринга, даже простой подстройки громкости — всего того, без чего не может обойтись создание студийного альбома, — невозможны для цифрой DSD записи по причине отсутствия нормальных алгоритмов ее обработки. Это означает, что все эти операции производятся с PCM форматом, и только после этого готовая PCM запись конвертируется в DSD. Впрочем, нужно отметить, что преобразование PCM > DSD и обратно — достаточно точное: лишь немного возрастает шум за пределами реального динамического диапазона (рис. 7). А значит, не имеет особого значения, в каком формате слушать запись: PCM Hi-Res или DSD — оба формата по качественным характеристикам очень схожи. Так же, фактически, нет смысла покупать отдельную звуковую карту для воспроизведения DSD, послушав совета приятеля, фаната данного формата.


    Рис. 7. Динамический диапазон / шум при преобразовании между DSD и PCM

Выводы


Итак, что выбрать DSD или PCM? Однозначного ответа нет и быть не может: PCM 24 бит 92 кГц и DSD128, например, очень схожи по качественным характеристикам, причем эти характеристики лучше, чем у аппаратуры, на которой эти форматы будут проигрываться, а значит дальнейшее увеличение качества цифровых форматов для воспроизведения на данном этапе нецелесообразно. При оценке качества звука разных форматов высокой чёткости на первый план выходят субъективные ощущения, ведь не качеством единым питается человеческий мозг: дизайн аппаратуры, ее стоимость, и, главное, самочувствие и настроение слушателя дают гораздо больший эффект на ощущения от прослушивания музыки. А значит выбирайте то, что нравится лично вам, и не навязывайте другим свое мнение. Всем приятного прослушивания!
Share post
AdBlock has stolen the banner, but banners are not teeth — they will be back

More
Ads

Comments 14

    0
    Оба метода ЦАП основаны на «баллистике». То есть в обоих случаях для преобразования используется некий «массивный» элемент (в случае электроники — элемент с большим импедансом), который «дергают» с высокой частотой в нужном направлении, из-за чего он плавно ползет туда, куда нужно. А слушатель, в свою очередь, воспринимает уже звук, производимый движением этого «массивного» элемента. Качество перекодирования при этом определяется тем, насколько правильно подобран импеданс. Если он слишком маленький, то подергивания не будут полностью сглажены, создастся высокочастотный шум (который, кстати, можно часто слышать в звуке дешевых игрушек типа поющих елочных гирлянд). Если слишком большой, то уже полезные высокие частоты исходного сигнала будут потеряны.

    Так что, как мне кажется, холивара тут нет. Оба метода абсолютно равноправны в плане потребительских свойств. Качество на выходе от выбора способа кодирования не зависит. Неоспоримое достоинство более популярного PCM, на мой взгляд, состоит в его наглядности и простоте кодирования/декодирования и обработки. Просто умножить аналоговый сигнал на глубину разрядности и округлить — что может быть проще! К тому же, PCM очень легко обобщается на использование плавающей точки. Что существенно для обработки звука.

    С другой стороны, DSD чрезвычайно удобен для ШИМ…
      +3
      Самое главное преимущество PCM в том, что его можно обрабатывать: от простой регулировки громкости до любой многоступенчатой обработки «сложными» эффектами. С DSD в этом плане всё печально: нормальных алгоритмов прямой цифровой обработки нет, выход только один — преобразование DSD > PCM и дальнейшая работа с PCM.
        0
        Согласен. Отсюда вывод. DSD полезен там, где надо как можно более просто выдать звук. То есть, например, автомобильную сигнализацию надо делать с прошивкой в этом формате :) А на компьютере лучше, всё же, использовать PCM.

        Тут есть еще один фактор, о котором я не подумал — устойчивость к ошибке.
        Один испорченный бит в PCM приведет к очень неправильному семплу и явному щелчку на дорожке.

        Один испорченный бит в DSD приведет к очень небольшому отклонению. Артефакт будет, но он будет почти неразличим. В этом плане при передаче сигнала по ненадежному каналу (типа телефонного) использование DSD было бы более целесообразно.
          0
          По поводу ошибок: довольно сложно придумать ситуацию, когда возможно появление ошибок.
          Есть, естественно, вариант повреждение носителя (оптический диск, винчестер, флешка).
          И есть некий гипотетический вариант передачи «незащищённого» DSD потока (без применения протоколов передачи данных) на большие расстояния.
            0
            Первый из перечисленных вами я наблюдаю у себя в автомобиле. «Заезженный» CD — как заезженная пластинка. Скрипит и хрюкает.

            Второй… А почему бы, собственно, нет? Иногда защита данных не столь критична, как факт передачи. Например, при передачи их из/в космос.
              0
              У вас в машине SACD плеер, или обычный CD?
              0
              На CD используются корректирующий код и перетасовка байтов.
              –1
              Артефакт будет, но он будет почти неразличим.

              Дробное различие — это сильно. Смысл в том, накопленные неразличимые отличия в растяженном по времени сигналу (треку) и составляют разницу в качестве тракта
          0
          У меня вопрос к автору. Каким образом был вычислен динамический диапазон для DSD? Какими методиками и формулами вы пользовались?
            0
            ДД я не вычислял, взял цифры из интернета, проверял в разных источниках.
            В статьях, посвящённых теории ШИМ, можно найти формулы для теоретического расчёта, но, во-первых, в задачи статьи это не входило, во-вторых, у меня лично не было особого желания посвящать этим расчётам время, ну и в третьих, практические цифры, зачастую, заметно отличаются от теоретических.
            Если бы у меня был хороший набор тестовых сигналов в DSD — можно было бы практически прикинуть ДД, Но из того набора тестовых сигналов, что мне удалось найти на просторах интернета, не получается измерить реальный динамический диапазон.
            Если у кого-то есть тестовые сигналы в DSD виде — скидывайте.
              0
              Перерыл весь интернет в поисках источника информации о ДД DSD, ничего конкретного найти не удалось. Статьи на википедии противоречат сами себе.
              Из статьи про DSD:
              DSD способен обеспечить динамический диапазон 120 дБ от 20 Гц до 20 кГц.

              Из статьи про CACD:
              этот сигнал имеет замечательные характеристики: динамический диапазон более 120 дБ, частотная характеристика от 0 до 100 кГц.

              Так же читал статьи на английском.Ссылаются на характеристики рекордеров, или на книги неких авторов в которых приводятся разные цифры, откуда они взяты не ясно.
              Думаю все же у DSD нет каких то конкретных ограничений, ограничения задает записывающее оборудование а точнее чип АЦП. А цифра 120 дБ либо ограничение формата CACD, либо взята из характеристик первых DSD плееров.
              По поводу тестовых сигналов можно взять раздачи с рутрекера, там полно оцифровок в dsd как домашних так и студийных. Проверить различные варианты тем самым подтвердить или опровергнуть тезис, вот только чем и как измерять?..
                0
                Думаю все же у DSD нет каких то конкретных ограничений, ограничения задает записывающее оборудование а точнее чип АЦП. А цифра 120 дБ либо ограничение формата CACD, либо взята из характеристик первых DSD плееров.

                Не всё так просто. Да, с помощью DSD мы можем чисто теоретически выдать идеальную тишину: это будет сигнал чередующихся 0 и 1, но передавая реальный звуковой сигнал, мы тут же встретим ограничения динамического диапазона с теоретической бесконечности до каких-то конкретный цифр, зависящих от «опорной» частоты DSD.

                По поводу тестовых сигналов можно взять раздачи с рутрекера, там полно оцифровок в dsd как домашних так и студийных. Проверить различные варианты тем самым подтвердить или опровергнуть тезис, вот только чем и как измерять?..

                К сожалению, обычные оцифровки с пластинок или копии с DSD-носителей не подойдут, там ДД будет зависеть от задумки композитора, записывающей аппаратуры или ограничений носителя. Нужны идеальные сгенерированные сразу в цифровом виде сигналы.
                  0
                  Теоретически думаю все таки можно посчитать ДД. Сигнал как мы знаем однобитный, если проигрывать этот сигнал через ФНЧ то можно представить его как ШИМ. Если 1 то напряжение возрастает если 0 падает. Максимально возможное количество единиц за секунду, исходя из опорной частоты DSD 2.822.400 Гц, равно этой частоте т.е. 2.822.400.Отсюда получается напряжение может повысится относительно теоретического ноля опять же на 2.822.400 уровня.Применяем формулу 20log(V) где V — это количество уровней, вероятно по этой формуле вычислялись значения приведенные в статье, получаем 129 дБ.

          Only users with full accounts can post comments. Log in, please.