Комментарии 136
В дополнение мы породим лишние горбы на характеристике, которые станут причиной интермодуляционных искажений.
А разве линейные цепи могут породить нелинейные искажения?
Вот косвенно — да. Если искажения формы сигнала вызовут «clipping», т.е. ограничение сигнала из-за выхода его за допустимые рамки.
… из этих соображений в пресетах пиковых лимиттеров для CD, выходной уровень обычно около -0.3dB, хотя для последующего дитеринга даже с нойз шейпом этого запасу овер дофига
Проблема в том, что нелинейные искажения в УНЧ растут с с ростом частоты. Достаточно посмотреть на зависимость коэффициента гармоник от частоты для многих УНЧ.
Так вот: берём мы 1 кГц. Оцифровываем, преобразуем обратно. Получаем наш 1 кГц и пары частот с разносом в 2 кГц. А вот тут приходит подлянка в виде интермодуляционных искажений: И мы получим разностную частоту в 2 кГц. А если это реальный сигнал? И вроде бы хороший УНЧ, который хорошо играл «тёплый ламповый» винил, начинает лажать на «нефильтрованной» цифре.
Получаем наш 1 кГц и пары частот с разносом в 2 кГц.
Вот эта пара частот с разносом в 2 КГц и есть интермодуляционные искажения! Тот же сумматор в гетеродинных приёмниках ни что иное, как производитель интермодуляционных искажений.
Да и 1% конденсаторы вообщем тоже;)
Это не так. Разве что керамика с диэлектриком NPO но они имеют малую ёмкость для звуковых ФНЧ, остальные технологически очень сложно сделать высокоточными
Кстати говоря 1% резисторы вполне себе доступны)
Сегодня они вполне доступны, это чистая правда. Но сравнительно просто их можно купить только из стандартного ряда. Теоретически экзотические номиналы можно собрать из двух или даже трёх включенных последовательно. Для фильтров нужны нестандартные. С конденсаторами дело обстоит гораздо хуже. Плюс те же конденсаторы
Насчёт "Для того, чтобы обрезать все, что лежит за границами звукового диапазона (20 кГц) и получить затухание под 40 дБ на 44 кГц" — могли бы просто поправить товарища — мол, резать-то надо не до частоты оцифровки, а до половины частоты, а разница 20-22 — совсем не то же самое, порядок фильтра запредельный получается.
Да, теорема Найквиста верна, но если даже по двум точкам можно восстановить частоту периодического сигналаЯ Найквиста не читал, но у Котельникова речь идёт именно о бесконечном сигнале. На практике, конечно же, в этом необходимости нет, поскольку необходимое количество точек ограничивает сама функция sinc — для 16-битного сигнала это 65536 точек, и даже оно является излишеством. А также шумы/искажения в исходном сигнале, в цапе (+ джиттер), в усилителе, акустике, комнате.
Бесконечный — это о времени. Вообще все понятия о спектре, преобразовании Фурье итд введены для бесконечных во времени сигналов. И это никак не связано с дискретизацией. Реальность тут вносит ещё один вид искажения: оконную функцию.
1. Сигнала ограниченного по спектру (может быть вы это имели в виду под «бесконечностью», но тогда надо говорить о бесконечности во времени, т.к. сигнал конечный по спектру бесконечен по времени).
2. Отсчеты снимаются моментально.
3. Для восстановления сигнала нужен генератор дельта-функции и идеальный ФНЧ.
Все три условия физически не реализуемы. Чаще всего вспоминают про ограничение #3 (идеальный ФНЧ), но остальные тоже важны, если что. Но про них, видать, мало помнят после сдачи лаб/зачетов/экзаменов :-)
А если применять switchet capacitor filter?
Опять проклятая цифра! ;-)
Опять проклятая цифра! ;-)
Вот тут уже даже я соглашусь без оговорок!
Кстати, а какой был DDS?
Много приходилось с ними работать, но сейчас стоит выбор между DDS и продвинутым ЦАПом. Пока не определился что лучше. DDS аппаратно выдаёт очень ограниченный спектр сигналов, а для ЦАП можно любой файл сформировать без особых проблем.
Кстати, а какой был DDS?
AD9830. Не я его выбрал, а он меня (потому, что он был и был распаян на макетку). Если-бы железо было с нуля — взял-бы SPI-ный и посовременнее.
DDS аппаратно выдаёт очень ограниченный спектр сигналов
Задача была частная, настройка/восстановление нескольких радиоприёмников. Простого DDS'а — более чем достаточно.
P.S.
Впрочем профессиональных спорщиков из этого форума никакой теорией не прошибёшь. Какие формулы не приводи, что не рисуй они просто слушают исключительно сами себя.
Не «этого», а «любого».
Только вот увидел 2 часть статьи, спасибо за подробные ответы.
Но к сожалению, судя по резюме, вы видимо не до конца поняли смысл вопросов.
x-------x
Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
x-------x
На самом деле в ветке обсуждения https://geektimes.ru/post/284272/#comment_9792346, ставилось 3 вопроса и в принципе, на них удалось ответить благодаря комментариям:Refridgerator и vintage
При этом вывод оказался не утешительным… мировое правительство не дремлет :)
Но давайте все резюмируем в одном месте:
x-------x
1. А действительно ли мы улучшили качество звука, добавив семплы, которые в оригинале (живом звуке) могли отличаться от тех, которые мы придумали(интерполировали)? Ведь, то что мы записали с частотой 44.1 КГц — было реально зафиксировано микрофоном, а то что было между записанными семплами нам не известно.
x-------x
Ответ:
— По теореме Котельникова, если мы записали звук с необходимой минимальной частотой дискретизации, то можем сгенерировать промежуточные точки в любом количестве.
Значит, если запись велась с частотой дискретизации 44.1 КГц (а макс. воспринимаемая частота человеком 20КГц) — то этого вполне достаточно, чтобы в последствии восстановить промежуточные точки с любой точностью которая имеет смысл для человеческого уха. Качество восстановления (близость к оригиналу) определяется качеством фильтра используемого при интерполяции.
Здесь, я думаю все согласны.
x-------x
2. На сколько далеко наша фантазия (прошу прощения, интерполяция :) может нас завести? Т.е. теоретически, мы можем интерполировать и 8битный звук и 4х…
x-------x
Ответ:
— По той же теореме Котельникова, минимальная частота дискретизации при которой, возможно восстановление сигнала без искажений должна быть в 2 раза больше макс. частоты встречающейся в оригинальном сигнале.
Т.е. если берем макс. воспринимаемую частота человеком 20КГц, то минимальная частота для оцифровки = 40КГц
— По битности (т.е. разрядности шкалы амплитуды), можно сказать так: минимальная разрядность оцифрованного сигнала, должна в 2раза превышать разрядность (чувствительность) человеческого уха.
x-------x
3. И о каком таком повышении качества мы говорим?
Для человека средний порог частоты воспринимаемого звука 20 кГц, мы воспроизводим с частотой 44.1 КГц — есть ли смысл в дальнейшем увеличении?.. Повышение точности воспроизведения на 2 разряда — единственное, что имеет отношение к реальному улучшению качества, хорошо, а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)
x-------x
Ответ:
— Собственно, ответ на этот вопрос и является ключевым, ведь смысл как раз таки в том, зачем снижать погрешность и шумы, если их человек и так уже не чувствует?
Здесь ясность внес комментарий vintage
"
Тут утверждается, что дискретность уха в один момент времени не превышает 5 бит, а 16 с головой покрывает весь динамический диапазон уха: https://geektimes.ru/company/audiomania/blog/246304/
"
Очень интересная статья, всем рекомендую ознакомиться.
Я же в свою очередь из других источников нашел информацию, что повышение громкости (амплитуды) человек способен отличить при изменении исходной громкости на 10%, т.е. 1Дб. Если мы примем максимальным диапазоном амплитуды воспринимаемый человеком без боли 130Дб, то можно самостоятельно грубо посчитать разрядность (чувствительность) человеческого уха. Для этого просто надо взяв за исходную амплитуду 0.1 Дб посчитать сколько дискретных «точек» человек может распознать до 130Дб, с увеличением каждой следующей «точки» на 10%.
В итоге получилось 78 точек, что соответствует 7битам с большим запасом (50 точек). Т.е. вот при таком грубом расчете с запасом, мы приходим к выводу, что для оцифровки и воспроизведения звука без потери качества (с точки зрения человеческого уха) достаточно 7*2=14 бит для шкалы амплитуды.
Отсюда вывод:
"
Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
"
— С этим, я не спорил, и честно говоря к цифровым извращениям испытываю большую тягу чем к аналоговым :)
Суть в другом, вот что мы сделали:
1. Поставили более дорогой ЦАП (с повышенной частотой дискретизации и разрядностью)
2. За счет придумывания(интерполирования) отсутствующих семплов на шкале времени CD — увеличили кол-во воспроизводимых семплов.
Но зачем?
Ведь увеличение интерполированных точек, повышение частоты дискретизации и разрядности на ЦАП не влияет на качество звука ВОСПРИНИМАЕМОЕ ЧЕЛОВЕКОМ, ибо ЦАП(16бит, 44.1 КГц) достаточно и даже с большим запасом.
Получается все эти «улучшения качества» с точки зрения человека воспроизводящего звук с CD — не более чем маркетинговый трюк…
Суть увеличения частоты дискретизации — замена дорогого, сложного, крупногабаритного аналогового ФНЧ высоких порядков (да еще с плохой ФЧХ) на связку простого и дешевого цифрового + простого и дешевого аналогового низкого порядка. Вот и все.
И улучшение качества в данном случае — это не улучшение исходного звука, это улучшение приближения звука на выходе системы к исходному.
1. Замена существующего оборудования имеющего ЦАП(16бит, 44.1 КГц) на оборудование с ЦАП имеющем повышенною частоту дискретизации и разрядности — не имеет смысла, так как разницы человек не услышит.
2. И так же думаю, что
замена РАБОТАЮЩЕГО дорогого, сложного, крупногабаритного аналогового ФНЧ высоких порядков (да еще с плохой ФЧХ) на связку простого и дешевого цифрового + простого и дешевого аналогового низкого порядка — не имеет смысла, если все паразитные шумы лежат за пределами человеческого уха.
Вот и всё :)
«И улучшение качества в данном случае — это не улучшение исходного звука, это улучшение приближения звука на выходе системы к исходному.»
— Поймите, в этом приближении нет смысла, если человек разницы почувствовать не может.
На графиках, всегда рисуют оцифрованный звук большими некрасивыми ступеньками, даже автор данной статьи прибегает к этому приему ;-)
Причем, после добавления промежуточных точек, график якобы становится «красивее» и ближе к оригинальному сигналу. Но, если мы увеличим масштаб раз в 10, то произойдет чудо… через те же самые дополнительные точки, которые красиво приближались к исходному сигналу, опять будут проходить большие некрасивые ступеньки, очень далекие от оригинального сигнала… И такое приближение можно делать до бесконечности опять добавляя промежуточных точек… Но зачем???
Смысл в том, что имея CD-проигрыватель с ЦАП(16бит, 44.1 КГц) человек смотрит на ступеньки с такого далекого расстояния и запасом, что ни одной мало мальски некрасивой ступеньки выступающей от оригинального сигнала увидеть не сможет при всем желании.
Я могу привести аналогию с TV. Сейчас становится модным формат 4K — и это хорошо, отличие от FullHD на глаз мало, но ЗАМЕТНО. Т.е. в 4К человек четко может сказать, что картинка лучше. Это всё почему?, потому, что по оценкам разных специалистов разрешение человеческого зрения около 50К — 100К. Так вот, когда появится телевизор с разрешением 200К, то тогда можно сказать, что это равносильно тому, что сейчас используется при воспроизведении с CD-проигрывателя с ЦАП(16бит, 44.1 КГц).
Те кто считает, что сравнивать разрядность/дискретизацию звука АЦП/ЦАП и чувствительностью человеческого уха нельзя, равно как разрешение для человеческого глаза — в общем смысле ошибаются. Да, напрямую нельзя, т.к. у человеческих органов есть своя специфика и не линейность чувствительности в разных зонах. Но грубо/приблизительно, привести к общему знаменателю и сравнить можно, а когда при сравнении мы видим более чем двух кратное превосходство, то можно уже делать выводы.
Подозреваю, что аппаратура с такими фильтрами находится либо в чуланах, либо у самых упоротых пользователей.
Сейчас подавляющее большинство (99 и не знаю сколько еще девяток после запятой %) делается именно так, как описано в статье. Хотя бы потому что это проще, лучше, стабильнее и дешевле.
Исторический экскурс так сказать.
Параметры цифрового фильтра абсолютно стабильны, он не нуждается в настройке, крайне дешев.
Параметры аналогового фильтра в системе с цифровым некритичны, он прост, и дешев.
В системе с аналоговым фильтром высоких порядков фильтр дорог, его параметры меняются в зависимости от температуры и со временем.
Так что даже если при выходе с производства обе системы будут иметь сравнимое качество звука (что уже объективно невозможно в связи с плохой ФЧХ полностью аналоговой системы), то со временем аналоговая будет звучать только хуже.
Какой смысл сохранять значительно более дорогую, объемную, тяжелую и нестабильную систему кроме «ятакхочу»?
Смысл в том, что если дорогая старая техника работает и претензий у пользователя к качеству звука нет, то поддаваться на маркетинговые уловки и выкидывать деньги на ветер не надо. На новой технике услышать «лучший» звук не получится.
Поймите, все эти «доступность аппаратуры», «стабильность характеристик», «ФЧХ»… всё это пыль, если итоговое качество звука СЛЫШИМОГО человеком — его устраивает. Если от температуры или от времени, параметры фильтра меняются, но я этого не могу услышать, то для меня они роли не играют. Если же старая аппаратура работает плохо и постоянно приходится ее перенастраивать, чтобы бороться с шумами и помехами, то конечно ее надо менять, с этим никто не спорит.
Где, в каком именно предложении автор предлагает хоть кому-то менять свой старый хлам, который его устраивает, на что-то новое??? Если кого-то устраивает патефон, то никаких проблем.
Это не маркетинговые уловки. Это всего лишь описание того как менялась техника. Было так-то, стало так-то. произошло это вот поэтому и вот поэтому. Все. ТОЧКА.
Давайте на этом уже закончим.
Для этого просто надо взяв за исходную амплитуду 0.1 Дб посчитать сколько дискретных «точек» человек может распознать до 130Дб, с увеличением каждой следующей «точки» на 10%.
В итоге получилось 78 точек, что соответствует 7битам с большим запасом (50 точек). Т.е. вот при таком грубом расчете с запасом, мы приходим к выводу, что для оцифровки и воспроизведения звука без потери качества (с точки зрения человеческого уха) достаточно 7*2=14 бит для шкалы амплитуды.
Это всего лишь означает, что для плавной (т.е когда человек не различает ступеньки) регулировки громкости достаточно 14 бит. Какое это имеет отношение к квантованию собственно сигнала?
а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)
Ухо вообще по другому работает. Там термин «разрядность» неприменим.
— Я исходил из того, что возможность услышать звук, зависит от его амплитуды. Самый тихий звук который мы можем услышать, характеризуется минимальной амплитудой (которою может чувствовать ухо), и соответственно самый громкий звук — максимальной амплитудой. Отсюда, мы можем определить мин. и макс. амплитуду которую может воспринимать человек, ну и соответственно, зная шаг изменения громкости, можно определить кол-во разрядов на шкале амплитуды для человека. Конечно, это грубо, и эта так сказать моя собственная оценка, если вы хотите более точного определения, можете обратиться к статье приведенной в комментарии выше.
«Ухо вообще по другому работает. Там термин «разрядность» неприменим.»
— На это я тоже ответил чуть выше.
шум, возникающий при квантовании сигнала по уровню из-за округления амплитуды до ближайшего дискретного значения. Гранулярный шум сильно связан с
сигналом (зависит от него), и представляет собой гармоники сигнала, искажения от которых наиболее заметны в верхней части спектра. Проявления гранулярного
шума и его связь с сигналом легко заметить, прослушав синусоидальный сигнал с частотой около 0.1..5 Гц — гранулярный шум в этом случае проявляется в виде
изменяющегося по высоте паразитного тона, частота которого зависит от частоты, формы и максимальной амплитуды полезного сигнала.
Мощность гранулярного шума обратно пропорциональна количеству ступеней квантования, однако из-за логарифмической характеристики слуха при линейном квантовании (постоянная величина ступени) на тихие звуки приходится меньше ступеней квантования, чем на громкие, и в результате основная плотность нелинейных искажений
приходится на область тихих звуков. Это приводит к ограничению динамического диапазона, который в идеале (без учета гармонических искажений) был бы равен
соотношению сигнал/шум, однако, необходимость ограничения этих искажений снижает динамический диапазон для 16-разрядного кодирования до 50-60 дБ."
Не все шумы и искажения, равные по амплитудному (процентному) соотношению будут равны по восприятию человеческим ухом. Почитайте статью. Учитывая дешевизну реализации ЦАПов с высокой разрядноситью, проще и дешевле просто свести уровень искажений, связанных с квантованием, до пренебрежимо малых величин и не мучаться. Нет никакого заговора. Это просто самое простое и эффективное решение проблемы с шумом квантования/гранулярным шумом на данный момент.
Сложность заключается в том, что музыка — это
Посему и любая попытка интерполяции улучшает объективные параметры и ухудшает собственно воспроизведение музыки.
Специально для людей, с такой точкой зрения написал целую статью где всё уже разжованно с картинками для уровня восприятия дошкольника.
Любая оцифровка коверкает звук.
Оцифрованный звук — это близко не исходный звук и хорошая интепорляция его только улучшает.
Без интеполяции запись с битрейтом CD вообще слушать невозможно.
Посему и любая попытка интерполяции улучшает объективные параметры и ухудшает собственно воспроизведение музыки.
Подобная точка может существовать, но если сказали А, надо говорить уже и B.
Слушать музыку необходимо только вживую, причём музыканты не должны пользоваться усилительной аппаратурой.
Аналоговая запись тоже не обходится без искажений.
На магнитную ленту пишут с подмагничиванием, что приближает запись к цифре, ну а для записи на винил сигнал предварительно серьёзным образом искажают и компрессируют.
Прослушивание же живых артистов в специальной студии не каждый миллиардер себе позволить может.
Оцифрованный звук — это близко не исходный звук
В данном случае, некорректное утверждение. Дискретизация (этот термин уместнее — видите, переходим на исходный английский и становится проще?) — это всего лишь способ зафиксировать процесс. Как его восстановить из записи — вот вопрос.
хорошая интепорляция его только улучшает.Еще можно сравнить с кино, 24 кадра в секунду типо достаточно для глаза, хотя на движущихся картинках нечеткость и смазанность очевидна. Когда появились достаточно доступные видеопроекторы бОльшего разрешения, чем 640х480, тоже стало очевидным, что из стандарта DVD бОльшее количество пикселей получить сложно. Точнее, интерполировать-то никаких проблем, картинка выходила гладкая, но, бестолковая — очевидно, деталей на ней не прибавлялось — потому как неоткуда им было взяться.
Тупое добавление нулей ничего не делает сисходником, а вот интерполяция — делает.
Да, есть интерполяция, которая искажает цифровой исходник с CD. Но нам, вообще говоря, абсолютно безразлично какие именно цифровые преобразования претерпевает сигнал. Нам важно, чтобы окончательный аналоговый сигнал на выходе усилителя как можно точнее повторял сигнал до оцифровки. Апсэмплинг не пытается добавлять никаких аналоговых «деталей» (в отличие от апскейлинга видеосигнала), его цель именно максимально приблизить форму выходного аналогового сигнала (после DAC и фильтров) ко входному (до ADC). Поскольку суммарная АЧХ цифрового и аналогового фильтров такова, что частоты, проходящие через него не превышают 44,1 кГц пополам, то никаких аналоговых «деталей» к звуку добавиться не может. Он делает то же самое, что и аналоговый фильтр без апсэмплинга, но дешевле, компактнее и без лишних фазовых искажений.
"24 кадра в секунду типо достаточно" для создания иллюзии непрерывного движения да, но мерцание с частотой 24Hz вы себе представляете? Это-же жесть, заметная даже упоротому транквилизаторами мозгу.
По этому в кино проекционном аппарате есть такая хренька — обтюратор, с двумя или тремя лепестками, которая во время экспозиции кадра, перекрывает световой поток, умножая частоту мерцания на 2 или 3!
В таком виде, кино смотреть в разы приятней, ибо частота мерцания оказывается за гранью восприятия.
PS.А что-бы не было смазывания, в киносъёмочном аппарате так-же был обтюратор, но более хитрый, сменный или настраиваемый, дабы сократить время экспозиции, ибо 1\24 секунды, это как бы дофига.
Но вы правы, приводить пример из области оперирующей пространственными частотами, там где люди с одномерным рядом разобраться не могут, действительно не уместно…
обтюратор, с двумя или тремя лепестками, которая во время экспозиции кадра, перекрывает световой поток, умножая частоту мерцания на 2 или 3!
В таком виде, кино смотреть в разы приятней, ибо частота мерцания оказывается за гранью восприятия.
Спасибо, именно эта аналогия ближе всего к процессу добавления нулей.
Без интеполяции запись с битрейтом CD вообще слушать невозможно
Вроде только то рассказали, что выходной фильтр нужен для того, чтоб не мучать усилитель ужосами, а не для того, чтоб уху лучше было.
Без фильтра и передискретизации в первую очередь страдает ВЧ область. Да, мы привыкли к перидискретизированному звуку, к «хрустальному», «воздушному» и т.д. Но это всего лишь звуковые эффекты, ненужные для восприятия музыки. Тот же стандарт LP был не очень-то и богат на ВЧ, а конусные ВЧ-динамики почти не воспроизводили выше 15-16кГц. Да и выходные трансформаторы не очень-то высоко играли. Так что просто мы привыкли за последние 20-30 лет к звону «высоких», а другого ХОРОШЕГО звука в СССР было почти и некому услышать.
Подытоживая — без передискретизации вполне даже слушабельно, если не искать звуковых спецэффектов.
Другое дело, что обычная аппаратура (кремниевый усилитель с ООС) будет работать с выходом ЦАПа без фильтра откровенно плохо.
А если аудиотракт типа этого, и слушается всё через мониторные наушники: «Швейцарская компания Nagra выпустила в продажу цифро-аналоговый преобразователь Classic DAC. Новинка представляет собой более доступную версию модели HD DAC и отличается от неё отсутствием регулятора громкости и усилителя для наушников, а также несколько изменённой аналоговой секцией. В последней используется по 9 тщательно подобранных транзисторов на канал, а отношение сигнал/шум (невзвешенное) выходного каскада достигает 145 дБ,» — то придётся и ЦАП ставить соответствующий. Другое дело, что рядовому гражданину для прослушивания русскава рэпа это не нужно.
Это же как прон в 4К. Не каждый найдёт удовольствие в разглядывании прыщиков на теле актрис и качестве бритья ;-). То ли дело VHS и кинескопный телек.
Итак:
Звучащий симфонический оркестр обладает динамическим диапазоном свыше 90дБ
Пусть мы используем весь динамический диапазон нашего 16 бит ЦАП. Тогда самый тихий звук оркестра будет -90 дБ от размаха. На него останется 6 дБ динамического диапазона а это...1 бит! Дада. самый тихий (но различимый) звук будет воспроизведён меандром ;-) А учитывая, что в симфонической музыке есть как громкие места так и тихие, то в тихих местах этот меандр будет прекрасно слышен. Ибо его просто нечему будет маскировать.
хитрое подмешивание шума.А сейчас, в силу дешевизны, используют лобовое решение: 24бит/192 кГц (или выше). И проблема с дискретизацией/квантованием уходит на дальний план и можно сосредоточиться на качественной аналоговой части типа 9 транзисторов и с/ш 145 дБ ;-)
Именно для того чтобы сгладить форму этих ступенек и используется передискретизация!!!
Речь то идёт о том, что надо воспроизводить не просто синус большой амплитуды. А реальный сигнал с динамическим диапазоном, практически перекрывающим динамический диапазон 16-битного ЦАП.
Итак: частота равна 1/10 от частоты дискретизации. Разрешение 16 бит. Идеальных, ибо кирпичик labView
А вот те же условия, но частота сигнала 0,5 от частоты дискретизации.
Меандр однако. При любой разрядности будет меандр :-)
А "плохой расклад" в данном случае — наличие хотя бы небольшой нелинейности в тракте?
Ограниченная скорость нарастания выходного напряжения? (Я не настоящий сварщик, так что вопросы, наверное, детские)
Далее — просто сама схемотехника (разводка, выбор элементов) может быть не адекватна для нормальной работы с высокими частотами, ибо делалась под ЗЧ.
А если УЗЧ класса D. То там вообще могут повылезти комбинационные частоты частоты дискретизации и частоты ШИМ.
Можно воспринимать как результат интерференции частоты тона и её «зеркальной» частоты. А можно понять как своего рода «стробоскопический» эффект.
Можно воспроизвести, нарисовав синус и делая дискретизацию руками и карандашём ;-)
Итак. Маленькое чудо:
Что мы имеем изначально. Сигнал с частотой 0,45 от частоты дискретизации:
А теперь делаем ресэмплинг 10х и фильтрацию
Никаких биений! Кстати — если просто соединять точки сплайнами а потом ресемплировать — то биения не уйдут.
Я всё таки больше по области hardware чем математики.
Впрочем профессиональных спорщиков из этого форума никакой теорией не прошибёшь. Какие формулы не приводи, что не рисуй они просто слушают исключительно сами себя.
я не согласен с тем что мастеринг делается на 16х44 щас даже самая нищая домашняя студия мастерит на 24х192. также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц. можете проверить взять песнь какогонибудь тенора пожать её семпл до 2кгц потом обратно растянуть до 44 и послушать. реально при прослушивании СД все что выше 8кгц давольно лживо звучит, а выше 16 скорее шум. слаа богу есть формат 24х192 к которому у меня нет притензий в плане достоверности ВЧ.
Но ещё очень многие слушают СD, и подавляющее количество звуковых карт даже в персональных компьютерах до сих пор 16 битные!
Также вы можете не соглашаться с тем, что Земля сферическая и обращается вокруг Солнца. Однако это никак не мешает именно Солнцу быть центром масс Солнечной системы.
взять песнь какогонибудь тенора пожать её семпл до 2кгц потом обратно растянуть до 44 и послушать
Хороший метод, Одобряю.Взять самолет, переехать бульдозером, а потом заявить «аппараты тяжелее воздуха летать не могут».
также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц.
20/44=0.4545 Пример восстановления с картинкой в сообщении выше.
Вы тоже можете проверить :-)
Возьмите какую-нибудь библиотечную литавру или сами оцифруйте гитару со стальными струнами, и будет результат.
Если задача показать, что для 20кГц не нужно 192кГц — так это Котельников/Шеннон/Найквист давно доказали.
Если задача показать, что человек не слышит выше 20 кГц — так это надо фокус-группу собирать и двойное слепое прослушивание устраивать.
Если задача показать, что в HD-записях нет частот выше 20 кГц — так их фильтровать не надо и собрать достаточное количество записей для репрезентативного анализа.
Если задача показать несовершенство алгоритма передискретизации в конкретно взятом аудио-редакторе — так надо его импульсную характеристику анализировать, а не какую-то конкретную аудиозапись.
щас даже самая нищая домашняя студия мастерит на 24х192.
тут такая же история как и с мегапикселями в мылницах и 700 Ваттах звука в аудиоцентре за 10 тыс деревянных.
На китайской коробке могут быть написаны любые цифры, там даже изредка могут стоять приличные микросхемы, но при этом одной только «грамотной» трассировкой можно так испортить звук
1. Задача ЦАП выдать не оригинальный сигнал, а сигнал неотличимый от оригинального на слух.
2. Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц и точностью дискретизации в 5 бит.
Если уж сравнивать, что человеческое ухо, это преобразователь импеданса, с АРУ и нелинейностями, и до фига полосный анализатор спектра, причём каждая полоса охвачена АРУ, срабатывание которого порождает импульс в соответствующем канале, далее уже мозг, но там всё ещё веселей…
… и да, мы знаем об этом достаточно много, что бы кодировать звук для кохлеарных имплантатов, или создавать иллюзию баса в наушниках, или чистый-прозрачный звук в мутной трансляционной сети, это всё психоаккустика называется
Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц и точностью дискретизации в 5 бит.
Ознакомьтесь, пожалуйста, с литературой (в гуголе легко находится электронный вариант):
Цвикер Э., Фельдкеллер Р. Ухо как приемник информации
У меня есть дела по интереснее
У меня тоже есть дела по интереснее, чем разжёвывать лентяям основы психоакустики ;-). Идите с миром… ;-)
Динамический диапазон уха (если не брать в расчёт разные степени болевых ощущений) — порядка 12 Б или 20 бит.
При этом громкость выше 10 Б никто в здравом уме выкручивать не будет. Уровня шумов ниже 3 Б добиться весьма не просто. Так что для записей остаётся лишь 7 Б, что чуть больше 10 бит.
Тем не менее при мастеринге звук всё равно компрессируют максимум в 4 Б, что чуть больше чем 6 бит. Но как правило жмут ещё сильнее, вплоть до 0,4 Б (ага, меньше бита на отсчёт).
Это всё, чтобы понимать масштаб трагедии — 90% населению планеты более чем достаточно 6 бит на отсчёт.
Почему? Да потому, что из-за эффекта маскировки звуки на 3 Б (или в 8 раз) тише от самого громкого в критической полосе уже не слышны. Для примера, можете попробовать, прошептать что-нибудь активно разговаривающим собеседникам находясь в метре от них. Услышат ли они вас?
2. Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц...
Возможно Вы хотели написать 40 КГц? А иначе люди бы не слышали звуки выше 10 КГц.
… и точностью дискретизации в 5 бит.
Это «работает» только для однотонального сигнала (в отсутствии других звуков или шумов).
Могу объяснить почему.
и точностью дискретизации в 5 бит.
Откуда у вас такая информация?
Тут где-то товарищ приводил порог различимости разных уровней громкости. Там было ЕМНИП 1 дБ.
Т.е. искажения АЧХ даже в самом пплохом случае на 4 порядка по величине меньше чувствительности человеческого уха.
Искажения АЧХ — линейные искажения. А их человеческое ухо воспринимает очень лояльно.
И пик в 0,0001 дБ,
а это в разах будет 1.00001, т е повышение амплитуды в 0,001%. Аналоговую часть это тоже не перегрузит.
И кстати да — там хорошие картинки насчёт разрядности и шума квантования.
Хочу завести ЦАП AK4452 в режиме DSD mode. Мне как инженеру чисто интересно.
Direct Stream Digital
Мои друзья аудиофилы
Why 1-Bit Sigma-Delta Conversion is Unsuitable
for High-Quality Applications
Там много математических выкладк, но заглавие громкое.
Есть и прямо противоположное
Why Direct Stream Digital is the best choice as a digital audio format
Слушал звук в DSD. По ощущениям как в кинотеатре. Шумов нет. Динамический диапазон широкий. На вскидку, без серьезной аппаратуры.
Хотелось услышать мнение по этому поводу. Может напишете еще одны статью? Часть III так сказать
Реcемплинг II. Сравнение работы цифровых и аналоговых фильтров высоких порядков в тракте звука и ответы на вопросы