Цифровое представление аналогового аудиосигнала. Краткий ликбез



Дорогие читатели, меня зовут Феликс Арутюнян. Я студент, профессиональный скрипач. В этой статье хочу поделиться с Вами отрывком из моей презентации, которую я представил в университете музыки и театра Граца по предмету прикладная акустика.

Рассмотрим теоретические аспекты преобразования аналогового (аудио) сигнала в цифровой.
Статья не будет всеохватывающей, но в тексте будут гиперссылки для дальнейшего изучения темы.

Чем отличается цифровой аудиосигнал от аналогового?


Аналоговый (или континуальный) сигнал описывается непрерывной функцией времени, т.е. имеет непрерывную линию с непрерывным множеством возможных значений (рис. 1).

рис. 1


Цифровой сигнал — это сигнал, который можно представить как последовательность определенных цифровых значений. В любой момент времени он может принимать только одно определенное конечное значение (рис. 2).

рис. 2


Аналоговый сигнал в динамическом диапазоне может принимать любые значения. Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.

Дискретизацией называется процесс регистрации (измерения) значения сигнала через определенные промежутки (обычно равные) времени (рис. 3).

рис. 3


Квантование — это процесс разбиения диапазона амплитуды сигнала на определенное количество уровней и округление значений, измеренных во время дискретизации, до ближайшего уровня (рис. 4).

рис. 4


Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).

рис. 5


Эти два процесса создают как бы координатную систему, которая позволяет описывать аудиосигнал определенным значением в любой момент времени.
Цифровым называется сигнал, к которому применены дискретизация и квантование. Оцифровка происходит в аналого-цифровом преобразователе (АЦП). Чем больше число уровней квантования и чем выше частота дискретизации, тем точнее цифровой сигнал соответствует аналоговому (рис. 6).

рис. 6


Уровни квантования нумеруются и каждому уровню присваивается двоичный код. (рис. 7)

рис. 7


Количество битов, которые присваиваются каждому уровню квантования называют разрядностью или глубиной квантования (eng. bit depth). Чем выше разрядность, тем больше уровней можно представить двоичным кодом (рис. 8).

рис. 8.


Данная формула позволяет вычислить количество уровней квантования:

Если N — количество уровней квантования,
n — разрядность, то

$N = 2^n$



Обычно используют разрядности в 8, 12, 16 и 24 бит. Несложно вычислить, что при n=24 количество уровней N = 16,777,216.

При n = 1 аудиосигнал превратится в азбуку Морзе: либо есть «стук», либо нету. Существует также разрядность 32 бит с плавающей запятой. Обычный компактный Аудио-CD имеет разрядность 16 бит. Чем ниже разрядность, тем больше округляются значения и тем больше ошибка квантования.

Ошибкой квантований называют отклонение квантованного сигнала от аналогового, т.е. разница между входным значением $X$ и квантованным значением $X'$ ($X-X'$)

Большие ошибки квантования приводят к сильным искажениям аудиосигнала (шум квантования).

Чем выше разрядность, тем незначительнее ошибки квантования и тем лучше отношение сигнал/шум (Signal-to-noise ratio, SNR), и наоборот: при низкой разрядности вырастает шум (рис. 9).

рис. 9


Разрядность также определяет динамический диапазон сигнала, то есть соотношение максимального и минимального значений. С каждым битом динамический диапазон вырастает примерно на 6dB (Децибел) (6dB это в 2 раза; то есть координатная сетка становиться плотнее, возрастает градация).

рис. 10. Интенсивность шумов при разрядности 6 бит и 8 бит


Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.

шум квантования


амплитуда сигнала при разрядности 1 бит (сверху) и 4 бит


Аудиопример 1: 8bit/44.1kHz, ~50dB SNR
примечание: если аудиофайлы не воспроизводятся онлайн, пожалуйста, скачивайте их.


Аудиопример 1


Аудиопример 2: 4bit/48kHz, ~25dB SNR


Аудиопример 2


Аудиопример 3: 1bit/48kHz, ~8dB SNR


Аудиопример 3


Теперь о дискретизации.

Как уже говорили ранее, это разбиение сигнала по вертикали и измерение величины значения через определенный промежуток времени. Этот промежуток называется периодом дискретизации или интервалом выборок. Частотой выборок, или частотой дискретизации (всеми известный sample rate) называется величина, обратная периоду дискретизации и измеряется в герцах. Если
T — период дискретизации,
F — частота дискретизации, то
$F=1/T$

Чтобы аналоговый сигнал можно было преобразовать обратно из цифрового сигнала (точно реконструировать непрерывную и плавную функцию из дискретных, «точечных» значении), нужно следовать теореме Котельникова (теорема Найквиста — Шеннона).

Теорема Котельникова гласит:
Если аналоговый сигнал имеет финитный (ограниченной по ширине) спектр, то он может быть восстановлен однозначно и без потерь по своим дискретным отсчетам, взятым с частотой, строго большей удвоенной верхней частоты.
Вам знакомо число 44.1kHz? Это один из стандартов частоты дискретизации, и это число выбрали именно потому, что человеческое ухо слышит только сигналы до 20kHz. Число 44.1 более чем в два раза больше чем 20, поэтому все частоты в цифровом сигнале, доступные человеческому уху, могут быть преобразованы в аналоговом виде без искажении.

Но ведь 20*2=40, почему 44.1? Все дело в совместимости с стандартами PAL и NTSC. Но сегодня не будем рассматривать этот момент. Что будет, если не следовать теореме Котельникова?

Когда в аудиосигнале встречается частота, которая выше чем 1/2 частоты дискретизации, тогда возникает алиасинг — эффект, приводящий к наложению, неразличимости различных непрерывных сигналов при их дискретизации.

Алиасинг


Как видно из предыдущей картинки, точки дискретизации расположены так далеко друг от друга, что при интерполировании (т.е. преобразовании дискретных точек обратно в аналоговый сигнал) по ошибке восстанавливается совершенно другая частота.

Аудиопример 4: Линейно возрастающая частота от ~100 до 8000Hz. Частота дискретизации — 16000Hz. Нет алиасинга.


Спектральный анализ


Аудиопример 5: Тот же файл. Частота дискретизации — 8000Hz. Присутствует алиасинг


Спектральный анализ


Пример:
Имеется аудиоматериал, где пиковая частота — 2500Hz. Значит, частоту дискретизации нужно выбрать как минимум 5000Hz.


Следующая характеристика цифрового аудио это битрейт. Битрейт (bitrate) — это объем данных, передаваемых в единицу времени. Битрейт обычно измеряют в битах в секунду (Bit/s или bps). Битрейт может быть переменным, постоянным или усреднённым.

Следующая формула позволяет вычислить битрейт (действительна только для несжатых потоков данных):

Битрейт = Частота дискретизации * Разрядность * Количество каналов

Например, битрейт Audio-CD можно рассчитать так:
44100 (частота дискретизации) * 16 (разрядность) * 2 (количество каналов, stereo)= 1411200 bps = 1411.2 kbit/s

При постоянном битрейте (constant bitrate, CBR) передача объема потока данных в единицу времени не изменяется на протяжении всей передачи. Главное преимущество — возможность довольно точно предсказать размер конечного файла. Из минусов — не оптимальное соотношение размер/качество, так как «плотность» аудиоматериала в течении музыкального произведения динамично изменяется.

При кодировании переменным битрейтом (VBR), кодек выбирает битрейт исходя из задаваемого желаемого качества. Как видно из названия, битрейт варьируется в течение кодируемого аудиофайла. Данный метод даёт наилучшее соотношение качество/размер выходного файла. Из минусов: точный размер конечного файла очень плохо предсказуем.

Усреднённый битрейт (ABR) является частным случаем VBR и занимает промежуточное место между постоянным и переменным битрейтом. Конкретный битрейт задаётся пользователем. Программа все же варьирует его в определенном диапазоне, но не выходит за заданную среднюю величину. 

При заданном битрейте качество VBR обычно выше чем ABR. Качество ABR в свою очередь выше чем CBR: VBR > ABR > CBR.

ABR подходит для пользователей, которым нужны преимущества кодирования VBR, но с относительно предсказуемым размером файла. Для ABR обычно требуется кодирование в 2 прохода, так как на первом проходе кодек не знает какие части аудиоматериала должны кодироваться с максимальным битрейтом.

Существуют 3 метода хранения цифрового аудиоматериала:

  • Несжатые («сырые») данные
  • Данные, сжатые без потерь
  • Данные, сжатые с потерями

Несжатый (RAW) формат данных


содержит просто последовательность бинарных значений.
Именно в таком формате хранится аудиоматериал в Аудио-CD. Несжатый аудиофайл можно открыть, например, в программе Audacity. Они имеют расширение .raw, .pcm, .sam, или же вообще не имеют расширения. RAW не содержит заголовка файла (метаданных).

Другой формат хранения несжатого аудиопотока это WAV. В отличие от RAW, WAV содержит заголовок файла.

Аудиоформаты с сжатием без потерь


Принцип сжатия схож с архиваторами (Winrar, Winzip и т.д.). Данные могут быть сжаты и снова распакованы любое количество раз без потери информации.

Как доказать, что при сжатии без потерь, информация действительно остаётся не тронутой? Это можно доказать методом деструктивной интерференции. Берем две аудиодорожки. В первой дорожке импортируем оригинальный, несжатый wav файл. Во второй дорожке импортируем тот же аудиофайл, сжатый без потерь. Инвертируем фазу одного из дорожек (зеркальное отображение). При проигрывании одновременно обеих дорожек выходной сигнал будет тишиной.

Это доказывает, что оба файла содержат абсолютно идентичные информации (рис. 11).

рис. 11


Кодеки сжатия без потерь: flac, WavPack, Monkey’s Audio…

При сжатии с потерями

акцент делается не на избежание потерь информации, а на спекуляцию с субъективными восприятиями (Психоакустика). Например, ухо взрослого человек обычно не воспринимает частоты выше 16kHz. Используя этот факт, кодек сжатия с потерями может просто жестко срезать все частоты выше 16kHz, так как «все равно никто не услышит разницу».

Другой пример — эффект маскировки. Слабые амплитуды, которые перекрываются сильными амплитудами, могут быть воспроизведены с меньшим качеством. При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.

Этим и пользуется кодек: 2kHz-звук можно убрать.

Спектральный анализ кодека mp3 с разными уровнями компрессии


Кодеки сжатия с потерям: mp3, aac, ogg, wma, Musepack…

Спасибо за внимание.

UPD:
Если по каким-либо причинам аудиофайлы не загружаются, можете их скачать здесь: cloud.mail.ru/public/HbzU/YEsT34i4c

Similar posts

Ads
AdBlock has stolen the banner, but banners are not teeth — they will be back

More

Comments 52

    –6
    цифровой сигнал это последовательность нулей и единичек, то, что у вас выдается за цифровой сигнал — это называется дискретный сигнал
      +3
      A digital signal is a signal that is being used to represent data as a sequence of discrete values

      Отличие дискретного от цифрового — последовательность.
      То есть приемник должен уметь определять где закончилась предыдущая цифра и началась новая, даже если это несколько одинаковых цифр подряд. Чаще всего используют временные промежутки, может быть какая-нибудь дополнительная синхронизация частоты передачи.
        +2
        Освежил себя из учебника по ЦОС, действительно, дискретный сигнал может принимать любые значения из интервала исходного сигнала при дискретизации, в то время как для цифрового значение каждого из отсчетов «округляется» к значению ближайшего кванта.
          0
          Ну там суть не в округлении, а в том, что дискретный сигнал — вы можете передавать что-то, и приемний в какой-то момент времени видит конкретное значение. Сейчас это 4, потом это 5. Но это не переданные «45»
          А цифровой сигнал он ближе к передаче пакета данных — идет последовательность значений, и вы четко должны получить, что было передано «45» или «444445» или «4555455»
      +4
      А зачем все картинки под спойлерами?
        +1
        На тощих каналах связи, или дохлых устройствах — хорошо, резиновый интервейс с резиновой вёрсткой не скачут как лихорадочные.
          +2
          Я бы лучше подождал, чем 20 раз жать на спойлеры. Это реально перебор.
          *Вздыхает, вспоминая веб с нормальной вёрсткой, с прописанными в html размерами картинок.
        +1
        Есть очень хорошая книжка по ЦОС для начинающих. Автор — Юкио Сато:

        publ.lib.ru/ARCHIVES/S/SATO_Yukio/_Sato_Yu..html
          0
          Я начинал с такой книги

          image

          Вот тут рассказывал по её примерам habr.com/ru/post/219337
          +1
          Спасибо, схоронил.
            +1
            Картинка «Интенсивность шумов при разрядности 6 бит и 8 бит» совершенно точно не соответствует действительности и уровень шумов в ней сильно занижен — даже если рассматривать чистую синусоиду, влияние шумов квантования на которую минимально.
              +2
              Сэмплы не то чтобы послушать, даже уже скачать не получается:
              image
              Хабраэффект в действии?
              0
              Я извиняюсь за глупый вопрос, но почему не существует «векторного» формата для записи аудио? Чтобы описать звуковую волну математическими формулами, вместо записи конкретных дискретных поинтов где эта волна находится в каждый момент времени
                +2
                Теорема Котельникова и описывает звуковую волну математическими формулами — через сумму sinc-функций, сдвинутых во времени.
                  +7
                  Вы сейчас почти изобрели преобразование Фурье)
                    0
                    Преобразование Фурье. Существует.
                    +1
                    Пардон муа, но вы упустили из виду вариант с 1-битной дельта-сигма модуляцией — которая дает очень неплохие результаты по качеству — SACD собственно так и родился.
                      0
                      SACD — унылый маркетологический формат, существующий лишь на пинковой тяге тёти Сони — обычный DVD-A его превосходит по эффективности. Чисто математически. Как формат хранения. Тут прослеживается ровно та же коммерческая история как в войне VHS и Betamax — желание оторвать кусок рынка недобросовестной рекламой.
                        0
                        Нет. Формат хранения в SACD — это DSD, DVD-A — PCM (в том числе и сжатый). Если в несжатом PCM инвертировать произвольный бит — это приведёт к щелчку, амплитуда которого будет зависеть от порядкового номера этого бита в слове. Если в сжатом PCM инвертировать произвольный бит — это приведёт к потере целого блока данных.

                        Другая проблема PCM — зависимость уровня шумов квантования от амплитуды:



                        DSD решает обе этих проблемы. А не стал он повсеместно используемым потому, что у него есть и недостаток — нельзя просто так взять и смикшировать DSD-потоки.
                          0
                          Если в несжатом PCM инвертировать произвольный бит
                          Вам не кажется, что вы на ходу сочиняете несуществующие проблемы? Вопрос целостности данных идёт параллельно вопросу дискретизации. Я ещё могу понять эти переживания в эпоху оптических дисков, хотя и там с этим боролись в несколько слоёв. А нынче — «bit perfect» и всё такое.

                          зависимость уровня шумов квантования от амплитуды
                          И? Ухо всё-равно неспособно расслышать столь малые уровни. Сам экспериментировал. Два-три децибела ниже уровня белого шума ещё как-то звук расслышать можно, но не более того.
                          Посчитайте, пожалуйста, разрешающую способность DSD на 20кГц. Для многих будет удивительно, насколько «более прогрессивный формат» окажется хуже того же PCM при том же битрейте.

                          Так что оба аргумента — высосанные из пальцев японских маркетологов. Это продолжение аудиофильской шизофрении на тему ТЛЗ, скин-эффекта, и т.п. Я этот форсинг мертворождённого формата внимательно наблюдал и тоже видел красивые картинки в глянцевых журналах. Там утверждали, что «сам способ записи SACD ближе к грам-записи» — уже от этого аудиофилы должны были испытывать экстаз.
                            0
                            Нет, не кажется, потому что вопрос целостности данных никак не связан с вопросом дискретизации. Аналоговые записи вас никто не заставляет оцифровывать — они вполне и дальше могут храниться на виниле и магнитных лентах.
                              0
                              При чём здесь аналоговые записи? Мы сравниваем DSD и PCM. И, соответственно, под «целостностью» я имел в виду не физическую сохранность аналоговых мастер-лент, а именно ваш гипотетический
                              в несжатом PCM инвертировать
                              Это чисто вопрос корректности/правильности/целостности передачи цифровых данных. Если вам считывающее устройство передаёт в ЦАП не то, что записано — это проблема именно передачи, а не формата хранения. То, что SACD якобы более «помехозащищён» — это весьма спорный вопрос. А в наше время флешек вопрос «читабельности» носителя вообще отпал, нивелировав это декларируемое преимущество.

                              Кстати, ЕМНИП, Sony как один из аргументов за DSD как раз и впаривала то, что нужно аналоговые мастер-записи в него переводить — магнитная лента не вечная, а на виниле мастера вообще не хранят.
                          0
                          Если же говорить о маркетинговом булшите — то это современные хи-рез релизы классических записей, предельно закомпрессированные, убитые шумодавами, с задранными ВЧ и прочими «улучшайзерами».
                        +1
                        раз уж про сигма-дельта модуляцию вспомнили
                        Ошибки квантования (округления) из-за недостаточного количество уровней не могут быть исправлены.

                        могут быть разменяны на частоту дискретизации через dithering и oversampling.
                        добавьте белого шума при оцифровке и задерите частоту дискретизации, ну и соответственно более злой НЧ фильтр при обратном преобразовании цифра->аналог, и вы получите ваш сигнал обратно, даже несмотря на очень грубое квантование.
                          0
                          А, собственно, DSD (и однобитное квантование вообще) и пытается это сделать. Впадая в крайность — уходят от ошибок по уровню, но получают кучу (ИМХО, гораздо бОльшую) других проблем. В этом плане PCM всё-таки более сбалансирован — там выжато всё что можно из обоих пределов точности квантования — что по уровню, что по времени.
                            +1
                            высокоразрядные АЦП — сигма-дельта с оверсэмплингом, так как у любых других АЦП с устройством выборки-хранения и последующей многобитной оцифровкой проблем с линейностью будет заметно больше. Так что это просто взяли и вытащили сразу выход модулятора наружу, кому надо — сам отфильтрует с децимацией и получит PCM с нужной разрядностью, ну или просто пропустит этот цифровой поток через аналоговый ФНЧ и получит аналоговый сигнал.
                            Места разве что занимает побольше, раза в три, 2.8Мбит/c, для 120дБ в полосе до 20кГц вместо 44кГц*24бита ~ 1МБит/c у PCM.
                            а кроме этого какие проблемы?
                            в интегральных микрофонах в качестве интерфейса вполне прижилось.
                              +1
                              И места больше занимает и обработку вести проблемно — всё цифровое ПО и железо — что дома, что в студиях — десятки лет затачивалось под ИКМ (PCM).

                              Линейое ИКМ при 44,1 кГц и 16 битах для восстановления каждой волны самой высокочастотной составляющей сигнала (22,05 кГц) использует 16 бит, что даёт 2^16 = 65536 уровней. Или 6дБ(разница уровней в 2 раза — каждый бит ИКМ)*16бит=известные 96дБ для CD-Audio формата. Для всего диапазона — от НЧ до ВЧ.

                              В SACD/DSD при 2,8224 МГц и 1-битном кодировании для ВЧ получается 2822,4/44,1кГц = 64 бита. Унарных бита! Там нет старших и младших. А значит динамический диапазон будет между 0 и 64 единицах — это будет 64 уровня вместо 65536 уровней. DSD «грубее» PCM на ВЧ на три порядка!

                              И DSD здесь «спасает» лишь то, что на реальном музыкальном материале самые ВЧ в принципе не бывают высоких уровней — им этих самых 30дБ (дельта-сигма модулятор первого порядка) и хватает.

                              Да, конечно, как вы упомянули, при помощи dither можно несколько улучшить картину. По некоторым заявлениям некоторых заинтересованных лиц:
                              довести его до 60 дб. Плюс noise shaping — до 90дБ.
                              И это для DSD — потолок. Для «старого» CD — 96дБ. Для конкурента SACD — DVD-Audio динамический диапазон уже 24*6=144дБ! А учитывая 192кГц оцифровки — можно ещё несколько децибел выжать при помощи того же оверсемплинга с фильтрацией!

                              Почему мы не видим слышим такой драматичной разницы на реальной аппаратуре. Да всё упирается в ограничения по «железу». Один только тепловой шум резисторов перекрывает весь потенциал 192/24. Не говоря уже про другие источники помех и искажений.

                              А есть ещё такое неприятное явление как джиттер — искажения, вызванные неточностью ЦАП во временнОм домене. Получил бит данных чуть позже или раньше — получи на выходе неверный уровень. Для DSD джиттер страшнее в силу более высокой частоты.

                              На самом деле ИКМ — вполне себе оптимальный формат. Он использует все достижения/возможности реального железа по точной дискретизации как по уровню, так и по времени. Нет ни одного фатального у него недостатка, чтобы потребовалось «изобретать» DSD. Упоролись в частоту, а потенциал по квантованию уровня просто выкинули.

                              Чисто маркетинговый ход — вывести на рынок бесполезную хрень, но, вложившись в рекламу, отгрызть кусок рынка, обложив его всякими лицензионными поборами.
                                0
                                В SACD/DSD при 2,8224 МГц и 1-битном кодировании для ВЧ получается 2822,4/44,1кГц = 64 бита. Унарных бита! Там нет старших и младших. А значит динамический диапазон будет между 0 и 64 единицах — это будет 64 уровня вместо 65536 уровней. DSD «грубее» PCM на ВЧ на три порядка!

                                это не совсем так, передискретизация в 64 раза не означает 6 бит разрешения, они не просто складываются-усредняются, noise shaping опять же.


                                то есть заявленные 120дБ у DSD они для всей полосы до 2.8Мгц/64/2 = 22кГц, на НЧ ещё лучше.


                                Ideal SNR and ENOB of 2nd Order ∆Σ Modulator for Different Decimation Ratios
                                Decimation Ratio (M) / Ideal SNR (dB) / Ideal ENOB (bits)
                                4 / 24.99 / 3.9
                                8 / 40.04 / 6.4
                                16 / 55.09 / 8.9
                                32 / 70.14 / 11.4
                                64 / 85.19 / 13.9
                                128 / 100.24 / 16.4
                                256 / 115.30 / 18.9
                                (не смог одолеть хабровский маркдаун и нормально вставить таблицу)


                                для модулятора третьего порядка с передескретизацией 64 и будет 122дБ


                                для преобразования DSD <> PCM в цифре надо лишь несколько сумматоров на sinc фильтр, и те же сумматоры с накоплением (интегратор) для обратного. Оно не лучше и не хуже, просто другое представление абсолютно тех же данных. Аналоговый сигнал удовлетворяющий Найквисту восстановится что из того что из другого абсолютно одинаково.


                                Никто этот DSD специально особо не изобретал, аудио АЦП — и так всегда были сигма-дельта из-за лучшей линейности, просто выкинули фильтр который выход модулятора из однобитного в PCM превращал, точнее перенесли из внутренностей АЦП в другое место, на сторону "пользователя".


                                всякие "изолирующие" аналоговые усилители, в которых с одной стороны был модулятор, потом однобитный цифровой поток передавался через опторазвязку и обратно фильтровался в аналоговый сигнал, подозреваю были задолго до "изобретения" SACD.

                                  +1
                                  передискретизация в 64 раза не означает 6 бит разрешения
                                  Почему нет? В Вики так и написано: K=2^N. 64=2^6. Без NS.
                                  Это Нойз-Шейпинг так феерически давит шумы квантования — с -40 до -120дБ? Можете дать ссылку на внятное объяснение? А то мне в основном попадаются либо простые статьи с цифрами, взятыми непонятно откуда, либо трёхэтажный матан.
                                  Либо заслуживающее доверия практическое измерение. Типа вот такой картинки:
                                  image
                                  Я чего так взъелся-то? Даже если вот те же 120дБ принять на веру, то это всё-равно хуже 144дБ на ДВД. Смысл тогда? Только как «более помехоустойчивый» для хранения на оптическом диске?
                                    0

                                    Ну вот ваша же картинка выглядит вполне себе неплохо.
                                    Шумы квантования давит noise shaping, от порядка модулятора зависит довольно сурово.
                                    Не то чтобы прям внятно и без матана:
                                    http://www.ti.com/lit/an/sbaa094/sbaa094.pdf?ts=1591010872307
                                    https://www.ieee.li/pdf/essay/calculating_delta-sigma_snr.pdf


                                    То что на двд пишут 24 бита == 144дБ это здорово конечно, но покажите мне хоть один АЦП который хотя бы 120дБ в полосе хотя бы 20кГц покажет, только честных децибел, а то некоторые умудряются туда ещё некое АЧХ человеческого уха подсунуть в качестве множителя и показывать смотрите как много децибел у нас получилось.
                                    Смысла в любом случае нет, на слух разницу между 16х44, 24х96 или DSD только упоротые аудиофилы в своих фантазиях различить могут ну или совсем мутанты какие-нибудь с абсолютным слухом.


                                    Передавать в некоторых случаях удобнее DSD, потому что не надо греть голову и договариваться приёмнику и передатчику о том сколько же там битов в отсчёте, где старший/младший и когда именно он начинается.

                          0

                          Надо было бы о DSD упомянуть...

                            0
                            Дискретизация разбивает сигнал по временной составляющей (по вертикали, рис. 5, слева).
                            Квантование приводит сигнал к заданным значениям, то есть округляет сигнал до ближайших к нему уровней (по горизонтали, рис. 5, справа).

                            По-моему, у вас горизонталь и вертикаль перепутаны.

                              0
                              А почему на первом рисунке синусоиды перекошены?
                                0
                                Хотелось бы у автора уточнить, есть ли основания считать, что аналоговый сигнал объективно «лучше/приятнее» для слуха, чем тот же Flac 24bit/48kHz? Такую теорию очень часто можно встретить среди меломанов предпочитающих современные виниловые записи.
                                  +1
                                  так виниловые записи просто вносят искажения в запись, которые некоторым нравятся
                                    +3
                                    среди меломанов предпочитающих современные виниловые записи.
                                    Не путаете ли Вы меломанов с аудиофилами?
                                    Меломаны слушают звук, а аудиофилы на него дрочат.
                                    0
                                    При громких низких частотах тихие средние частоты не улавливаются ухом. Например, если присутствует звук в 1kHz с уровнем громкости в 80dB, то 2kHz-звук с громкостью 40dB больше не слышим.

                                    Может ошибаюсь, но вроде как наоборот и со знаком минус: -40dB и -80dB.

                                    Впрочем фигня все это, с Артистом, владеющим тайной игры на этом чудесном инструменте я бы предпочел обсуждать не децибелы, а что-то вроде того, как молодому Шломо Минтцу тогда в семидесятых удалось, исполняя каприччио номер 6 Паганини достичь одному звучания целого оркестра, такого как BBC Philarmonic под управлением Vassily Sinaisky в Anatoli Lyadov — The Enchanted Lake.
                                      0
                                      как молодому Шломо Минтцу тогда в семидесятых удалось, исполняя каприччио номер 6 Паганини достичь одному звучания целого оркестра

                                      Такое звучание у Шломо Минца связана в первую очередь с особенностями этого каприса.
                                      Шестой каприс Паганини написан в полифоническом стиле, т.е. имеет многоголосную фактуру. К двухголосному контрапункту добавляется еще и третья линия, но в отличие остальных, она не непрерывная, а написана в орнаментике «тремоло». Всё это создаёт эффект полноты звучания, что и ассоциировался у Вас с звучанием оркестра. Если говорить образно, то фактура шестого каприса похожа на вселенную, где в пространстве-времени (мелодия) быстро «мерцают» звёзды-пульсары (тремоло). Этот каприс довольно трудный и неудобный для исполнения как с музыкальной стороны (интерпретация), так и с технической и физиологической стороны (тремоло сильно нагружает мышцы предплечья). Сам часто его играл (https://youtu.be/H2lyVC1VnaM).
                                        +1
                                        Спасибо за развернутый ответ.

                                        (Не совсем понятно, если говорят об муз. орнаменте, то это вроде как trill, а tremolo — скорее прием игры, на «tr» начинаются оба)
                                          +2
                                          В шестом каприсе Паганини используется не трель (trill), а тремоло (tremolo), так как «трель — это быстрое чередование двух соседних нот» (малая/большая секунда),
                                          а тремоло — это «быстрое чередование двух нот, расстояние которых не меньше терции» (но возможно и быстрое повторение одной и той же ноты — это тоже тремоло).
                                          В шестом каприсе чередуются не соседние ноты.
                                          И тремоло, и трель являются орнаментами.
                                            0
                                            Являюсь только слушателем, причем даже не продвинутым, так под настроение, не все же время слушать Judas Priest, Megadeth, Rammstein и им подобных. Шестое каприччио запомнилось больше в исполнении того же Минца и еще Рабина и Когана. Можно сказать слегка подсел на этих исполнителей в том числе, среди которых еще с разными произведениями Миша Эльман, Хасид, иногда Хейфец и др.
                                            Шестое каприччио запомнилось еще своим названием, если не ошибаюсь «Il trillo». Поэтому мне казалось, что этот муз. орнамент и есть «trill». Спасибо, что развеяли этот мой внутренний миф.
                                      0
                                      Аналоговый сигнал преобразуется в цифровой с помощью двух процессов — дискретизация и квантование. Очередь процессов не важна.
                                      Странно, разве можно выполнить квантование перед дискретизацией? Получается квантование аналогового сигнала.
                                        0
                                        квантование аналогового сигнала...

                                        … можно выполнить и без дискретизации:

                                        Заметим, что квантование по сути тоже является дискретизацией. Только дискретизацией не по времени, а по значению. Т.е. дискретные сигналы бывают:
                                        -дискретными по времени
                                        -дискретными по значению
                                        -дискретными по времени и по значению

                                          0
                                          квантование по сути тоже является дискретизацией
                                          Об этом и надо было в статье написать. А то получается введение лишней — второй сущности. Когда процесс один, но просто применяемый к двум непрерывно изменяющимся величинам — «уровню звука» и «времени».
                                          0
                                          Есть АЦП на компараторах. Они, по сути, непрерывны во времени. Это и есть квантование до дискретизации.
                                            0
                                            Все АЦП — на компараторах. Вопрос в том, тактируемые эти компараторы или нет, и в том, как сохраняется и передается дальше сигнал с них. Но теоретически да, можно собрать флэш-матрицу из нетактируемых комрапаторов и получить АЦП с квантованием, но без фиксированной дискретизации по времени.
                                              0
                                              Да, все. Но разница в их количестве. Дешевле поставить 1, но качественный (меньше шума, лучше чувствительность и т.д.), но потребуется регистр последовательного приближения. А если разрядов надо мало но нужна скорость — ставят паралельно несколько компараторв и дискретизируют непрерывный сигнал с них. Все быстрые АЦП так построены, например К1107ПВ2 или К1107ПВ3. Только вот разрядов там 8 и 6:
                                              image
                                              image
                                                0

                                                Выходной буферный регистр — тактируемый, так что ваш пример не подходит. А ещё бывают другие архитектуры, кроме флэша и последовательного приближения. И, кстати, там где разрядов мало, но нужна скорость, ставят регистры последовательного приближения ещё как. Например, большинство схем приемников 100G-400G Ethernet ставят регистры последовательного приближения на 9 бит и 1-2 Гигавыборки.

                                                  0
                                                  Выходной буферный регистр — тактируемый, так что ваш пример не подходит.

                                                  Подходит, если рассматривать этот чип как 2 устройства в 1. Компараторы там непрерывные. Ну а тактировать запись в регистр можно с абсолютно любой частотой от 0 до максимально возможной для конкретного экземпляра микросхемы.
                                          0
                                          А как обычно рассчитывается ошибка интерполяции? Всё-таки по Котельникову семплов тоже должно быть бесконечное количество.
                                            0
                                            Нет, конечный набор семплов никак не противоречит теореме Котельникова. Он просто продолжается в бесконечность нулями или зацикливанием в зависимости от того, непрерывный спектр или дискретный.

                                          Only users with full accounts can post comments. Log in, please.