SOUNDPAL 30 апр 2015 в 12:24

Отличия аналогового звука от цифрового

8 мин

177K

Комментарии 52

zuborg 30 апр 2015 в 14:24

Вопрос — возможна ли теореретически и практически ситуация, когда две звуковых волны будут иметь существенно различную форму (т.е «голубая линия» будет существенно отличаться, и не просто сдвигом, например), но будут восприниматься полностью (абсолютно и 100% полностью) идентично?
Зависит ли эта возможность от самой формы звуковой волны?

Дополню — а возможна ли ситуация, когда для определенной формы звуковой волны будет невозможно подобрать никакую другую звуковую волну с полностью идентичным восприятием?

SADKO 30 апр 2015 в 14:55

Да…
Нет…

Человеческий мозг не оперирует абсолютной амплитудой сигнала, предельно упрощая можно сказать что ухо суть спектроанализатор,
передаёт в мозг значения частотных полос… А если вдаваться в детали, так там ещё и предварительная динамическая обработка сигнала в целом, и каждой отдельной полосы в частности. От этого только пляшет хренова туча психоакустических эффектов, хотя по сути ими не являются, не говоря уже о действительных особенностях восприятия мозгом…

НЛО прилетело и опубликовало эту надпись здесь

romanrex 30 апр 2015 в 18:39

когда две звуковых волны будут иметь существенно различную форму (т.е «голубая линия» будет существенно отличаться, и не просто сдвигом, например), но будут восприниматься полностью (абсолютно и 100% полностью) идентично?

Над этим работают алгоритмы психоакустического сжатия, такие как mp3, ogg и т.п. — форма волны упрощается, но без ощутимых потерь для восприятия.

amarao 30 апр 2015 в 14:50

Как показывают психоакустические исследования, дальнейшее повышение частоты дискретизации мало заметно, а вот повышение разрядности дает субъективное улучшение.

Как показывают исследования, авторы этого поста пренебрежительно относятся к теме и читателям и ставить ссылки на источники не намерены.

«Исследования показали, что если три раза в день стучать по дереву, то вероятность раковой опухоли уменьшается в 2 раза».

SADKO 30 апр 2015 в 14:57

Да и картиночки с потолка взяты…
Ну а что вы хотите, статья не о чем.

romanrex 30 апр 2015 в 18:59

Если «с потолка» = «неправильные», потрудитесь найти ошибки.

AndreyDmitriev 30 апр 2015 в 19:44

Картинки просто очень «поверхностные». На первых четырёх частота дискретизации значительно превышает частоту сигнала (ну если представить, что это примерно кусок синусоиды). Согласно теореме Найквиста частота дискретизации более чем вдвое превышающая частоту сигнала позволяет восстановить сигнал абсолютно точно. Ну вот представьте себе синусоиду 20 килогерц и точки примерно на 44 КГц — они попадут почти точно на полупериоды — как такой сигнал восстанавливается? Про aliasing, oversampling, undersampling ничего не сказано (извиняйте за английские термины). Про фильтр нижних частот — тоже ничего, а это важно. Имело смысл начать с основ DSP (при этом рассказать доступно, но не настолько поверхностно, как это в статье сделано).

romanrex 30 апр 2015 в 20:04

В один материал не воткнуть целый учебник и к сложному идут от простого. Вы же не предлагаете начать с DSP, а потом пояснять, что такое аналоговый сигнал?

Касаемо «Ну вот представьте себе синусоиду 20 килогерц и точки примерно на 44 КГц — они попадут почти точно на полупериоды — как такой сигнал восстанавливается? „

20 кГц не попадет точно на полупериоды при частоте дискретизации 44 кГц. Если восстанавливать синус по теории Найквиста, то надо взять не менее 441000 точек, и среди них будут те, что попадут на вершины полуволн. Другое дело, в музыкальном сигнале анализ должен строится по гораздо меньшему количеству точек и это дает биения на высоких частотах и никак не противоречит теории Найквиста, т.к. в его теории нет учета количества точек.

AndreyDmitriev 30 апр 2015 в 20:13

Ну я имел ввиду, что случай, когда мы приближаемся к частоте Найквиста — он довольно интересный сам по себе. Вообще рассказать просто о сложном и в правильном порядке — это определённое искусство.

zuborg 1 мая 2015 в 13:24

Если «с потолка» = «неправильные», потрудитесь найти ошибки.

Можете объяснить, что означают «ступеньки» на второй картинке? Это форма сигнала на выходе ЦАП при проигрывании цифрового сигнала? Если не на выходе — то где именно сигнал имеет форму этих ступенек? Если нигде, то почему эти ступеньки изображены на одном графике в общем контексте с гладким аналоговым сигналом?

romanrex 1 мая 2015 в 16:57

Ступеньками аналоговый сигнал строят сигнал мультибитные ЦАП вместо гладкой волны. Современные ЦАП строят сигнал чередой импульсов, где после сглаживающих фильтров получается гладкая волна.

zuborg 1 мая 2015 в 18:15

Вынужден Вас разочаровать, но гладкий сигнал на выходе ЦАП-а получается отнюдь не сглаживанием ступенек.
Равно как и мультибитные ЦАП-ы вовсе не строят аналоговый сигнал ступеньками.

romanrex 4 мая 2015 в 15:14

Просвятите, как именно строит аналоговый сигнал R2-R мультибит.

zuborg 4 мая 2015 в 21:57

После небольшего гугления вынужден признать, что вопрос гораздо глубже, чем я полагал до этого. Частично свою роль сыграло это видео с xiph.org…

С одной стороны, да, нагугленная теория по работе ЦАП-ов показывает, что они дискретно меняют сигнал соответственно полученному коду. Дальше работают сглаживающие фильтры, ну и плюс играет роль физическая невозможность моментально изменить уровень сигнала — задержка изменения уровня сигнала тоже его сглаживает…

С другой стороны — это всего лишь один из подходов, который распространен в силу своей простоты. Грубо говоря — можно получить не ступеньчатый сигнал банальной линейной интерполяцией, или вообще полностью гладкий сигнал, используя сплайны. Это всего лишь пример, т.к. те же сплайны не решают вопрос восстановления граничных частот. Так что ступеньки — это вовсе не эквивалент цифрового сигнала, это всего лишь один из методов его преобразования в аналоговый (весьма несовершенный, надо сказать). Сам же цифровой сигнал представляет из себя отсчеты, т.е. точки на дискретной сетке (на xiph.org приводится удачная аналогия, что пикселы — это отнюдь не квадраты, а математические точки — узлы квадратной сетки).

romanrex 4 мая 2015 в 23:13

xiph.org — молодцы, в плане аналогии с пикселями. Хотя многим еще надо разжевать, что пиксели не обязательно должны быть квадратными.

Суть же материала выше в том, повсеместное рисование цифрового звука ступеньками — это пережиток первого поколения ЦАП-ов R2-R, именно ступеньками выглядел сигнал на выходе.

Сейчас ступенек нет за счет использования ЦАП-ов на основе дельта-сигма. Пока что эта технология доминирующая.

romanrex 30 апр 2015 в 18:47

Если будет интересен материал про форматы высокого разрешения, то это можно сделать.

amarao 30 апр 2015 в 20:10

Я не хочу «материал», я хочу увидеть ссылки на исследования. Если можно, в рецензируемых журналах.

romanrex 30 апр 2015 в 22:15

Исследования, от серьезных, до поверхностных проводились разными людьми в разное время с аналогичным результатом. Результат был получен давно и соответственно не относится к малоизвестным или спорным теориям.

На текущий момент у меня нет доступа к закрытой части aes.org, что бы дать дать ссылку или название конкретного документа на исследование. Но если желание есть и хороший уровень английского, посмотрите, может материал уже устарел настолько, что выложен в открытый доступ.

amarao 30 апр 2015 в 22:33

Ну хотя бы на школяре искали бы.

Потому что мне совершенно не очевидно, особенно с поправкой на «субъективно».

Такие вещи давать без ссылок — это уподобляться «учёные доказали» и прочей желтушной низкопробной журналистике.

spuf 30 апр 2015 в 15:13

На самом деле интересно реальное различие, в процентах, цифровой и аналоговой волны при разных параметрах оцифровки.

romanrex 30 апр 2015 в 19:07

Проценты, как и любая бальная система должны базироваться на определенной методике, а такой методики нет.

kosmos89 30 апр 2015 в 15:37

>Мультибитный ЦАП можно представить как принтер, способный наносить цвет пантоновыми красками.
Может все-таки полутоновыми?

romanrex 30 апр 2015 в 18:15

Пантон — это обозначение фиксированного цвета. Типографии при использовании штампов используют уже готовые краски определенного цвета. Так же и мультибит на выходе выдает определенный уровень.

kosmos89 1 мая 2015 в 21:23

Тогда и дельта-сигма ЦАПы выдают фиксированные уровни, причем гораздо меньше, чем у мультибитовых. Но у обоих сигнал на выходе проходит через ФНЧ, и четких ступенек там не будет.

romanrex 3 мая 2015 в 23:05

Допустим, у нас два 2-х битных ЦАПа, мин и макс уровни — от 0 до 3 В (для упрощения примера).
На выходе у мультибита будут фиксированные уровни, 0, 1, 2 и 3 В.
На выходе у дельта-сигма однобитный поток с уровнем 0 и 3 В. В отличии от мультибита, где на один семпл одно переключение уровня, у дельта-сигма последовательность импульсов (для примера пусть будет 6 импульсов на такт).
0=0, 0, 0, 0, 0, 0
1=0, 0, 3, 0, 0, 3
2 = 0, 3, 3, 0, 3, 3
3 = 3, 3, 3, 3, 3, 3

В случаем с мультибитом у нас «ступеньки», в случае с дельта-сигма — высокочастотный меандр. Разумеется, до сглаживающих фильтров. В этом вся суть.

После сглаживающих фильтров у мультибита ступеньки сглаживаются, но что бы ступенек не было видно на осциллографе, необходимо делать аппроксимацию волны, добавляя промежуточные значения. Для 44100 кГц это повышение частоты дискретизации от 8x и выше.

kosmos89 4 мая 2015 в 10:46

Ну так и для дельта-сигмы надо повышать частоту. Аналоговый сигнал сам себя не восстановит.

romanrex 4 мая 2015 в 14:47

Дельта-сигма изначально работает на повышенных частотах.

kosmos89 4 мая 2015 в 14:52

А sinc кто делать будет?

romanrex 4 мая 2015 в 15:23

Конкретизируйте вопрос. неясно, какое отношение это имеет к аналогии «пантон против печати мелкими точками».

kosmos89 4 мая 2015 в 15:50

Я к тому, что высокочастотный меандр «издалека» тоже выглядит как постоянный уровень, ступенька. После сглаживания и мультибит и дельта-сигма выглядят одинаково. И оба эти способа будут давать сигнал с «зазубринами», если предварительно его не интерполировать.

romanrex 4 мая 2015 в 16:47

Каким образом меандр может выглядеть ступенькой? Это череда импульсов одинаковой амплитуды.

kosmos89 4 мая 2015 в 16:54

В среднем — ступенька.
Вот тут www.pavouk.org/hw/dacshapes/en_index.html видно, что дельта-сигма ЦАП дает точно такую же форму, что и мультибит с LPF. Надо только сделать скидку на то, что в 5102 встроен интерполяциооный фильтр, а в 1704 — нет.

romanrex 4 мая 2015 в 17:36

Часть ЦАП-ов имеет смешанную архитектуру multibit delta sigma, отсюда и ступеньки.

Частота разрешения и наличие сглаживающих фильтров не дают увидеть меандр от Дельта-сигма, но позволяют увидеть последствия мультбитного подхода.

kosmos89 4 мая 2015 в 22:16

PCM5102 является чистым delta-sigma — ступеньки видны.
WM8740 является гибридным — ступенек не видно совсем.

romanrex 4 мая 2015 в 23:07

www.ti.com/general/docs/datasheetdiagram.tsp?genericPartNumber=PCM5102&diagramId=SLAS764B
Обратите внимание на слово «Segment» — это смысловой аналог «мультибит».

В тесте только один ЦАП можно считать «упрощенным» до базовых основ, это AD1865 и PCM1704. Остальные имеют уже сложную архитектуру.

На WM8740 не указано, включен ли его встроенный фильтр, этот ЦАП практически не требует никакой обвязки, все вшито заранее.

Sadler 30 апр 2015 в 18:41

Мои источники звука

Гитара.

m1el 30 апр 2015 в 19:16

xiph.org/video/vid2.shtml

institor 30 апр 2015 в 19:47

Бесполезно. Не верят. «до сих пор нет единого мнения, какое количество координат и точность данных является достаточным», «однозначного ответа нет» и т.п.

romanrex 30 апр 2015 в 22:31

Видео снято очень красиво и наглядно, но некоторые вещи сильно упростили, из-за чего складывается впечатление, что например разрядность выражается исключительно в уровне шума, как у аудиокассеты, и достаточно всего 13 бит. На деле «цифровой шум» зависит от сигнала, в отличии от шума аудиокассеты, где шум сам по себе. На видео не зря показали разные варианты дизеринга для борьбы с шумом.

romanrex 30 апр 2015 в 23:05

http://geektimes.ru/post/242775/#comment_8186989

Здесь никто так денег и не срубил, а только заминусили SADKO и всё?

SADKO 1 мая 2015 в 04:39

Весёлая история, увы так никто и не решился, хотя я рассчитывал что на «авторитет» xiph кто-то купится, у них же всё вроде-бы логично и правдоподобно, дьявол прячется лишь в деталях. (наверное по этой-же причине, невниманию к деталям, кодек xiph и получился уг...)

Хотя собственно если внимательно прочитать что в той теме народ по написал и включить мозги, то предмет спора из плоскости технической целесообразности переходит в плоскость биологическую, те способен ли человек эту разницу воспринимать…
Хотя на самом деле, и этот вопрос снимается элементарными расчётами, или не менее простым экспериментом очевидным для умного человека, никакой супертехники\слуха для этого не надо, только мозги…

Lsh 1 мая 2015 в 00:34

>Но до сих пор нет единого мнения, какое количество координат и точность данных является достаточным
Почему-то мне кажется что Котельников, Шеннон и Найквист не согласятся.

romanrex 1 мая 2015 в 17:55

Вы про чистый синус или музыкальный сигнал? Какой уровень погрешности?

НЛО прилетело и опубликовало эту надпись здесь

romanrex 2 мая 2015 в 11:00

Постройте синус по двум точкам, не ошибившись с амплитудой. Уверен, материал по ссылке помочь не сможет, т.к. дает лишь общую теорию.

kosmos89 2 мая 2015 в 13:26

Зачем вам строить синус по двум точкам?

НЛО прилетело и опубликовало эту надпись здесь

romanrex 2 мая 2015 в 20:25

Вы определитесь, с чем спорите. В чем несогласие с тезисом о количестве точек и теорий Котельникова, Шеннона с Найквистом. С одной стороны вам и двух точек достаточно для точного построения граничной частоты, с другой говорите про 10 точек. Спор ради спора с самим собой?

Сделать точную аппроксимацию волны в частотах близких к половине частоте дискретизации нет уж легко и просто.

Восстановить синус по теории Котельникова в граничных частотах можно, но при условии, что для аппроксимации будет большое количество координат, в противном случае будем наблюдать биения. Однако музыкальный сигнал не состоит из непрерывных синусов с низменной амплитудой, и аппроксимацию необходимо делать на ограниченном отрезке, что дает огромное поле для компромиссов — много координат, потеря импульсных характеристик, мало координат — страдает точность гармонических сигналов.

evtomax 3 мая 2015 в 17:55

Может перестанем обсуждать частоты, близкие к половине частоты дискретизации, а начнём обсуждать реальный музыкальный сигнал?

Я вот на лично на практике проверил и даже поделился результатами. На реальном музыкальном сигнале теоремы работают отлично. И есть все основания, чтобы закрыть спор о применимости теорем раз и навсегда. Единственный спорный вопрос — возможности человеческих ушей. Если считать, что выше 20 кГц человеческие уши ничего не слышат, то 44100 Гц хватит всем!

romanrex 3 мая 2015 в 23:13

«Я вот на лично на практике проверил и даже поделился результатами.»

Наверно не помешала бы ссылка на «поделился»?

НЛО прилетело и опубликовало эту надпись здесь

Зарегистрируйтесь на Хабре, чтобы оставить комментарий