Реcемплинг II. Сравнение работы цифровых и аналоговых фильтров высоких порядков в тракте звука и ответы на вопросы

  • Tutorial
Внимание — эта публикация является уточнением первой части статьи и ответом на вопросы из комментариев к ней. Для понимания о чём в ней идёт речь, необходимо ознакомиться с предыдущей если вы этого ещё это не сделали.

Среди многочисленных комментариев к моей последней статье были два очень характерных вопроса — от группы людей, которых я условно могу отнести к категории “практиков”, и человека, который, возможно сам того не желая, озвучил позицию близкою многим аудиофилам.
Мне стало ясно, что далеко не всем понятны объяснения, основанные на теории спектрального разложения сигнала и дальнейшей манипуляцией с гармониками. Ниже я сделал попытку осветить отдельные вопросы из предыдущей статьи ещё более наглядно.

Итак, под катом рассмотрим две темы:


Почему цифровые фильтры в трактах обработки звука не всегда зло
Почему аналоговые фильтры высокого порядка сложно реализовать в серийных устройствах

Попробую раскрыть обе эти заслуживающие внимания темы как можно более доступным языком.



Почему цифровые фильтры в трактах обработки звука не всегда зло



Вопрос первый от FreeMind2000:

Просветите не специалиста? ;)

Первоначальная цепочка такая:
1) Живой звук -> АЦП(16бит, 44.1 КГц) -> CD
2) CD -> 16бит -> Микроконтроллер -> ЦАП(16бит, 44.1 КГц) -> восстановленный звук

После апгрейда:
2) CD -> 16бит -> Микроконтроллер + (Некий фильтр преобразующий 16бит в 18, 44.1 КГц в 44.1*4) -> ЦАП(18бит, 44.1*4 КГц) -> восстановленный звук

Т.е. в апгрейде мы всего лишь:
1. Поставили более дорогой ЦАП (с повышенной частотой дискретизации и разрядностью)
2. За счет придумывания(интерполирования) отсутствующих семплов на шкале времени CD — увеличили кол-во воспроизводимых семплов.
Верно?

Тогда, внимание, вопрос:
1. А действительно ли мы улучшили качество звука, добавив семплы, которые в оригинале (живом звуке) могли отличаться от тех, которые мы придумали(интерполировали)? Ведь, то что мы записали с частотой 44.1 КГц — было реально зафиксировано микрофоном, а то что было между записанными семплами нам не известно.

2. На сколько далеко наша фантазия (прошу прощения, интерполяция :) может нас завести? Т.е. теоретически, мы можем интерполировать и 8битный звук и 4х…

3. И о каком таком повышении качества мы говорим?
Для человека средний порог частоты воспринимаемого звука 20 кГц, мы воспроизводим с частотой 44.1 КГц — есть ли смысл в дальнейшем увеличении?.. Повышение точности воспроизведения на 2 разряда — единственное, что имеет отношение к реальному улучшению качества, хорошо, а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)


Да, теорема Найквиста верна, но если даже по двум точкам можно восстановить частоту периодического что немаловажно сигнала, то это не значит что это с успехом может сделать DAC, особенно без применения фильтров! Тем более это касается сложного сигнала, представляющего из себя суперпозицию большого числа гармоник, порой резко появляющихся и исчезающих или меняющих тон.
Для того, чтобы проникнуть в суть проблемы необходимо понять следующее — совершив акт операции оцифровки мы тем самым невозвратно исказили сигнал. Даже если использовали идеальный микрофон, усилитель и аналого-цифровой преобразователь.

Давайте для наглядности перейдём от теории к практике и изобразим форму исходного сигнала на фоне сигнала, выходящего с идеального DAC.



Напомню, что DAC или по русски ЦАП через равные промежутки времени извлекает оцифрованное значение и фиксирует его на своём выходе. В результате мы получаем ступенчатый сигнал. На нашем рисунке минимальный шаг по вертикали и горизонтали равен одной клеточке. За ширину ступенек отвечает частота оцифровки, а дискретность по вертикали определяется разрядностью АЦП. Как от неё зависит качество оцифрованных сигналов видно на примере оцифровки второго бита. Реальное значение лежит практически посередине между двумя допустимыми целочисленными значениями, которое может присвоить сэмплу АЦП. Оно выбрало нижнее, и мы получили весьма большую ошибку. Надеюсь, теперь всем понятно почему даже в идеальном АЦП младший разряд нельзя считать значащим.



Посмотрим что же делает наша микросхема от SONY. Она в увеличила частоту сэмплирования в 4 раза. Мало того, она ещё и по вертикали добавила разрешения за счёт того, что увеличила разрядность сигнала с 16 до 18 бит. Далее, с помощью фильтра производится аппроксимация сигнала и вставляются три промежуточные точки, причём точность их установки выше как по горизонтали так и по вертикали в 4 раза, чем до сделанных преобразований. Аккуратной расстановкой этих точек занимается фильтр. Чем выше его порядок, тем качественнее он производит аппроксимацию.
Однако, после выполнения этих операций мы всё равно имеем ступенчатую структуру, не изображённую на рисунке — вместо них я изобразил жирные точки на трёх первых сэмплах. И тут уже в дело вступает простейший фильтр низкой частоты второго-третьего порядка, который сглаживает эти ступеньки. Результат показан ниже:



Здесь карандашная кривая — исходный сигнал.
Красная кривая — сигнал на выходе 16 битного ЦАПа.
Зелёный участок кривой — то что мы получили после операции ресемплинга и последующего применения простейшего фильтра.
Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
Замечу, что первое слева колебание имеет основную гармонику где-то в районе 44/7=6 килогерц, при этом на вид весьма сильно искажается при оцифровке с частотой 44 КГц. Представляете насколько будет похожим на оригинал сигнал с частотой в 17 килогерц?
Тут важно отметить то, что цифровые фильтры при желании могут не тронуть опорных точек полученных с 16 битного ЦАП — лишь расставить между ними вспомогательные, сглаживая кривую по своему усмотрению.
В силу ряда причин, это невозможно сделать применяя вместо цифры аналоговые фильтры высоких порядков. Тут кстати самое время перейти к вопросу вернее утверждению, высказанному AntonSor и горячо поддержанному dernuss


Почему аналоговые фильтры высокого порядка сложно реализовать в серийных устройствах



Tекст комментария AntonSor:
Для того, чтобы обрезать все, что лежит за границами звукового диапазона (20 кГц) и получить затухание под 40 дБ на 44 кГц, да с ровной фазовой характеристикой, требуется (с ровной — это фильтр Баттерворта) фильтр 7 порядка, это три операционных усилителя и по 10 5%-е резисторов и конденсаторов на канал. Да, громоздко, но не невозможно. Два счетверенных операционных усилителя типа TL074. В любительском приемнике прямого преобразования бывает больше (в фазовращателе).


Чтобы не заниматься все праздники ликбезом, я лишь вскользь упомяну, что качественные фильтры высокого порядка невозможно построить на операционных усилителях общего применения, к которым относятся TL074 от TI.
Совсем немаловажно, что аналоговые фильтры низкой частоты высоких порядков порождают серьёзные фазовые искажения, особенно в районе частоты среза. Доказывать эту общеизвестную истину чередой длинных формул нашим глубокоуважаемым товарищам я также не стану, лишь приведу картинку из одной моей прошлой статьи, которая показывает как жестого фазовые искажения обходятся с формой сигнала.



А в заключении по просьбе трудящихся остановлюсь на причине, по которой без точно подобранных номиналов деталей, фильтры высокого порядка не будут давать красивых идеальных расчетных характиристик, как на нижеприведённой нормированной по частоте зависимости ослабления сигнала от порядка фильтра Баттерфорта в логарифмических координатах.



Для того, чтобы построить фильтр, приближающийся по этому параметру к цифровому, описанному в прошлой статье, необходим восьмой — десятый порядок.

Ниже показаны передаточная функция идеального ФНЧ и фильтров Баттерфорта разных порядков.



Каким образом обычно строятся подобные фильтры? Очень просто — берётся ФНЧ второго порядка построенный, например, по приведённой ниже схеме…



Отлично, давайте посмотрим на график, который показывает как меняются параметры фильтра Баттерворта второго порядка обратите внимание что по горизонтали отложен линейный масштаб от разброса номиналов компонентов в цепи обратной связи.



А теперь представим себе суперпозицию передаточных характеристик нескольких таких звеньев с разными частотами среза, обусловленных разбросом компонентов.



Нетрудно догадаться, что мы не получим в результате эффекта повышения крутизны фильтра в зависимости от порядка. В дополнение мы породим лишние горбы на характеристике, которые станут причиной интермодуляционных искажений.
На самом деле ситуация ещё хуже потому, что разброс влияет не только на частоту среза, но и на другие параметры каждого из звеньев. Полученный в результате отфильтрованный звук в исполнении рака, лебедя и щуки возможно годится по качеству для динамика на выходе регенеративного приёмника, но попытка применить его в высококачественном DAC ничего кроме нездорового смеха у потенциальных покупателей не вызовет.

Вместо послесловия


Вместо послесловия публикую пару картинок от пользователя zerg59, который не поленился смоделировать
в ЛабВью аудиотракт с генератором сигнала, ацп, цапом и ресэмплером



Сигнал на выходе ЦАП с частотой 0.45 от частоты дискретизации. Хорошо просматриваются «нулевые биения»


Тот же сигнал, прошедший ресемплинг и цифровой фильтр десятого порядка

P.S. Не смог удержаться от использования в заголовке фрагмента рисунка из прекрасного комментария к первой части от пользователя Refridgerator
Поделиться публикацией
Комментарии 135
    +1
    В дополнение мы породим лишние горбы на характеристике, которые станут причиной интермодуляционных искажений.

    А разве линейные цепи могут породить нелинейные искажения?
      +3
      Это не суть важно, поскольку операционный усилитель является ещё тем нелинейным элиментом!
        +1
        Если «tutorial», то важно. Понятно, что в нашей суровой реальности нелинейность может возникнуть в самых неожиданных местах. Даже просто в паяном соединении в виде окисла. Но просто линейный фильтр с сильно кривыми АЧХ и ФЧХ сам по себе ничего нового (в смысле новых частот) в сигнал не внесёт.
        Вот косвенно — да. Если искажения формы сигнала вызовут «clipping», т.е. ограничение сигнала из-за выхода его за допустимые рамки.
          +1
          Ещё про усилители: пример в статье с фазовыми искажениями хорош тем, что показывает, как один и тот же по громкости по ощущениям на слух сигнал может требовать разных по мощности усилителей. Нижний сигнал потребует более мощного усилителя, ибо его амплитуда выше. А вот мощность та же. А теперь возьмём реальный звуковой сигнал. Его на стадии сведения аккуратно вписали в динамический диапазон 16-битного формата. Воспроизводится он ЦАПом, имеющим вполне определённый максимальный размах. А вот если мы дальше поставим аналоговый фильтр, то из-за фазовых искажений, даже при расчётном коэффициенте пропускания в единицу сигнал может выйти за ожидаемые рамки, что вызовет кране мерзкие искажения в виже ограничения сигнала («clipping»).
            0
            А вот это, судя по комментариям, до некоторых вообще не доходит, хотя проблема реальная, и актуальная даже для некоторых цифровых связок…
            … из этих соображений в пресетах пиковых лимиттеров для CD, выходной уровень обычно около -0.3dB, хотя для последующего дитеринга даже с нойз шейпом этого запасу овер дофига
        +1
        Ещё вспомнил, зачем вообще нужен это фильтр на выходе, если «человек усреднённый» выше 20 кГц не слышит:
        Проблема в том, что нелинейные искажения в УНЧ растут с с ростом частоты. Достаточно посмотреть на зависимость коэффициента гармоник от частоты для многих УНЧ.
        Так вот: берём мы 1 кГц. Оцифровываем, преобразуем обратно. Получаем наш 1 кГц и пары частот с разносом в 2 кГц. А вот тут приходит подлянка в виде интермодуляционных искажений: И мы получим разностную частоту в 2 кГц. А если это реальный сигнал? И вроде бы хороший УНЧ, который хорошо играл «тёплый ламповый» винил, начинает лажать на «нефильтрованной» цифре.
          0
          Видимо, поэтому Агеев сделал свой СЛ таким высокочастотным. А так, вообще, в большинстве усилителей стоит простейший RC фильтр (1 кОм и 100 пФ)
            +1
            Получаем наш 1 кГц и пары частот с разносом в 2 кГц.

            Вот эта пара частот с разносом в 2 КГц и есть интермодуляционные искажения! Тот же сумматор в гетеродинных приёмниках ни что иное, как производитель интермодуляционных искажений.
              0
              Смеситель. И AFAIK идеальный смеситель должен сигналы перемножать, а не суммировать.
              0
              С тёплым, ламповым винилом, тоже не всё так просто, там гораздо более агрессивный мастеринг чем в CD, так что пикфактор фильтры раздувают НО, это ещё цветочки по сравнению с пылинками на пластинке, от которых предусилитель\тон-корректор спроектированный по тупому, захлестнёт водопадом переходных процессов :-)
              0
              Ну вот, я думал тут будет про устойчивость фильтра;)
              Кстати говоря 1% резисторы вполне себе доступны)
                0
                Да и 1% конденсаторы вообщем тоже;)
                  +1
                  Да и 1% конденсаторы вообщем тоже;)

                  Это не так. Разве что керамика с диэлектриком NPO но они имеют малую ёмкость для звуковых ФНЧ, остальные технологически очень сложно сделать высокоточными
                    0
                    http://ru.mouser.com/ProductDetail/Kemet/C2220C474F5GACTU/?qs=Fn3VdHBzkcl72mr9SVJjcA%3d%3d

                    50volts 0.47uF 1%
                      +1
                      Спасибо за ссылку, взял на заметку, а теперь посмотрите на его размеры и цену. А потом на ряд доступных номиналов.
                      Описанный в статье чип для ресемплинга стоит дешевле одного этого кондёра!
                        0
                        Верно, про размеры я уже говорил в предыдущей статье.
                        Цена тоже параметр.
                      +1
                      Позвольте не согласиться: керамике, даже с NPO, в звуковом тракте делать нечего. Хорошая плёнка — наше всё.
                        +1
                        Согласен.
                        Но плёнку, особенно хорошую невозможно сделать тонкой просто из-за особенностей технологии изготовления.
                        Опять замкнутый круг.
                    0
                    Кстати говоря 1% резисторы вполне себе доступны)

                    Сегодня они вполне доступны, это чистая правда. Но сравнительно просто их можно купить только из стандартного ряда. Теоретически экзотические номиналы можно собрать из двух или даже трёх включенных последовательно. Для фильтров нужны нестандартные. С конденсаторами дело обстоит гораздо хуже. Плюс те же конденсаторы как и резисторы но в меньшей степени не идеальны. Но разбор этих неидеальностей — большая и интересная тема для отдельной статьи.
                      0
                      Большие фирмы вполне себе могут позволить изготовление компонентов на заказ.
                        0
                        Можно вообще сделать керамическую подложку и нанести на неё практически какие угодно резисторы и потом ещё и лазером подогнать. И это доступно ещё с 70-х годов прошлого века точно. И керамика там не богопротивный сегнетоэлектрик, как в большинстве керамических конденсаторов, а вполне себе кошерный оксид алюминия например.
                    +2
                    Извините, но все эти размышления на пальцах «лучше-хуже» без спектрального анализа и примеров соответсвующих спектров совершенно бесплодны.
                      +2

                      Насчёт "Для того, чтобы обрезать все, что лежит за границами звукового диапазона (20 кГц) и получить затухание под 40 дБ на 44 кГц" — могли бы просто поправить товарища — мол, резать-то надо не до частоты оцифровки, а до половины частоты, а разница 20-22 — совсем не то же самое, порядок фильтра запредельный получается.

                        0
                        Наш товарищ очень настойчив, к тому же не у него одного возникают подобные вопросы.
                        0
                        Да, теорема Найквиста верна, но если даже по двум точкам можно восстановить частоту периодического сигнала
                        Я Найквиста не читал, но у Котельникова речь идёт именно о бесконечном сигнале. На практике, конечно же, в этом необходимости нет, поскольку необходимое количество точек ограничивает сама функция sinc — для 16-битного сигнала это 65536 точек, и даже оно является излишеством. А также шумы/искажения в исходном сигнале, в цапе (+ джиттер), в усилителе, акустике, комнате.
                          0
                          Вы не путаете квантование и дискретизацию?
                            0
                            нет.
                              0
                              И тогда каким образом 65536 уровней квантования напряжения (тока) 16-ти битного ЦАП связаны с дискретизацией сигнала (во времени), о которой идёт речь у Котельникова?
                                0
                                Для понимания этого нужно вспомнить о том, как именно происходит восстановление сигнала, и что sinc(x) это sin(x)/x. Поделить на x. После того, как мы поделим квантованную амплитуду на значение, превышающее количество уровней квантования, полезного сигнала не останется. И это легко проверяется на практике.
                                0
                                И ли вы о том, что для 16 бит оверсэмплинг более чем в 2^16 раз смысла не имеет? Но это совсем о другом. Хотя и здесь можно поиграться с дизерингом в духе 1битных ЦАПов ;-).
                                Бесконечный — это о времени. Вообще все понятия о спектре, преобразовании Фурье итд введены для бесконечных во времени сигналов. И это никак не связано с дискретизацией. Реальность тут вносит ещё один вид искажения: оконную функцию.
                                  0
                                  Ещё один плюс оверсэмплинга: уменьшается влияние джиттера в выходном ЦАПе: ведь чем меньше изменяется сигнал между отсчётами — тем меньше искажений вносит джиттер.
                                0
                                У Котельникова (да и Найквиста и прочие названия) говориться об оцифровке:
                                1. Сигнала ограниченного по спектру (может быть вы это имели в виду под «бесконечностью», но тогда надо говорить о бесконечности во времени, т.к. сигнал конечный по спектру бесконечен по времени).
                                2. Отсчеты снимаются моментально.
                                3. Для восстановления сигнала нужен генератор дельта-функции и идеальный ФНЧ.

                                Все три условия физически не реализуемы. Чаще всего вспоминают про ограничение #3 (идеальный ФНЧ), но остальные тоже важны, если что. Но про них, видать, мало помнят после сдачи лаб/зачетов/экзаменов :-)
                                  0
                                  Хорошо, периодически повторяющийся и бесконечный во времени если вам угодно. реальный звуковой сигнал ни в коей мере не подходит под это определение.
                                0
                                А если применять switchet capacitor filter?
                                  +1
                                  При проектировании аналоговых фильтров — надо ещё учитывать желаемый коэффициет усиления каскадов фильтра (если оно нам нужно) и, при любом усилении, — требования к частотным свойствам ОУ. Что-бы не быть голословным — в недавнем home-made измерителе АЧХ (аналоговый осциллограф + DDS) понадобился фильтр для ШИМа, формирующего горизонтальную развёртку. При частоте среза двухкаскадного фильтра около 7 кГц и общем коэффициенте усиления 2.2 — калькулятор фильтров от Texas Instr. даёт требуемую полосу частот ОУ уже в 1 МГц.

                                  А если применять switchet capacitor filter?

                                  Опять проклятая цифра! ;-)
                                    0
                                    Опять проклятая цифра! ;-)

                                    Вот тут уже даже я соглашусь без оговорок!
                                    Кстати, а какой был DDS?
                                    Много приходилось с ними работать, но сейчас стоит выбор между DDS и продвинутым ЦАПом. Пока не определился что лучше. DDS аппаратно выдаёт очень ограниченный спектр сигналов, а для ЦАП можно любой файл сформировать без особых проблем.
                                      0
                                      Есть dds с озу, например AD9954.
                                        0
                                        Кстати, а какой был DDS?

                                        AD9830. Не я его выбрал, а он меня (потому, что он был и был распаян на макетку). Если-бы железо было с нуля — взял-бы SPI-ный и посовременнее.
                                        DDS аппаратно выдаёт очень ограниченный спектр сигналов

                                        Задача была частная, настройка/восстановление нескольких радиоприёмников. Простого DDS'а — более чем достаточно.

                                        P.S.
                                        Впрочем профессиональных спорщиков из этого форума никакой теорией не прошибёшь. Какие формулы не приводи, что не рисуй они просто слушают исключительно сами себя.

                                        Не «этого», а «любого».
                                      0
                                      progchip666
                                      Только вот увидел 2 часть статьи, спасибо за подробные ответы.

                                      Но к сожалению, судя по резюме, вы видимо не до конца поняли смысл вопросов.

                                      x-------x
                                      Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
                                      x-------x

                                      На самом деле в ветке обсуждения https://geektimes.ru/post/284272/#comment_9792346, ставилось 3 вопроса и в принципе, на них удалось ответить благодаря комментариям:Refridgerator и vintage
                                      При этом вывод оказался не утешительным… мировое правительство не дремлет :)

                                      Но давайте все резюмируем в одном месте:
                                      x-------x
                                      1. А действительно ли мы улучшили качество звука, добавив семплы, которые в оригинале (живом звуке) могли отличаться от тех, которые мы придумали(интерполировали)? Ведь, то что мы записали с частотой 44.1 КГц — было реально зафиксировано микрофоном, а то что было между записанными семплами нам не известно.
                                      x-------x
                                      Ответ:
                                      — По теореме Котельникова, если мы записали звук с необходимой минимальной частотой дискретизации, то можем сгенерировать промежуточные точки в любом количестве.

                                      Значит, если запись велась с частотой дискретизации 44.1 КГц (а макс. воспринимаемая частота человеком 20КГц) — то этого вполне достаточно, чтобы в последствии восстановить промежуточные точки с любой точностью которая имеет смысл для человеческого уха. Качество восстановления (близость к оригиналу) определяется качеством фильтра используемого при интерполяции.
                                      Здесь, я думаю все согласны.

                                      x-------x
                                      2. На сколько далеко наша фантазия (прошу прощения, интерполяция :) может нас завести? Т.е. теоретически, мы можем интерполировать и 8битный звук и 4х…
                                      x-------x
                                      Ответ:
                                      — По той же теореме Котельникова, минимальная частота дискретизации при которой, возможно восстановление сигнала без искажений должна быть в 2 раза больше макс. частоты встречающейся в оригинальном сигнале.
                                      Т.е. если берем макс. воспринимаемую частота человеком 20КГц, то минимальная частота для оцифровки = 40КГц
                                      — По битности (т.е. разрядности шкалы амплитуды), можно сказать так: минимальная разрядность оцифрованного сигнала, должна в 2раза превышать разрядность (чувствительность) человеческого уха.

                                      x-------x
                                      3. И о каком таком повышении качества мы говорим?
                                      Для человека средний порог частоты воспринимаемого звука 20 кГц, мы воспроизводим с частотой 44.1 КГц — есть ли смысл в дальнейшем увеличении?.. Повышение точности воспроизведения на 2 разряда — единственное, что имеет отношение к реальному улучшению качества, хорошо, а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)
                                      x-------x
                                      Ответ:
                                      — Собственно, ответ на этот вопрос и является ключевым, ведь смысл как раз таки в том, зачем снижать погрешность и шумы, если их человек и так уже не чувствует?
                                      Здесь ясность внес комментарий vintage
                                      "
                                      Тут утверждается, что дискретность уха в один момент времени не превышает 5 бит, а 16 с головой покрывает весь динамический диапазон уха: https://geektimes.ru/company/audiomania/blog/246304/
                                      "
                                      Очень интересная статья, всем рекомендую ознакомиться.
                                      Я же в свою очередь из других источников нашел информацию, что повышение громкости (амплитуды) человек способен отличить при изменении исходной громкости на 10%, т.е. 1Дб. Если мы примем максимальным диапазоном амплитуды воспринимаемый человеком без боли 130Дб, то можно самостоятельно грубо посчитать разрядность (чувствительность) человеческого уха. Для этого просто надо взяв за исходную амплитуду 0.1 Дб посчитать сколько дискретных «точек» человек может распознать до 130Дб, с увеличением каждой следующей «точки» на 10%.
                                      В итоге получилось 78 точек, что соответствует 7битам с большим запасом (50 точек). Т.е. вот при таком грубом расчете с запасом, мы приходим к выводу, что для оцифровки и воспроизведения звука без потери качества (с точки зрения человеческого уха) достаточно 7*2=14 бит для шкалы амплитуды.

                                      Отсюда вывод:
                                      "
                                      Надеюсь, что FreeMind2000 и его сторонники согласятся, что “чистый неискажённый ступенчатый звук с выхода ЦАП” выглядит меньше похожим на оригинал, чем исковерканный цифровыми извращениями?
                                      "
                                      — С этим, я не спорил, и честно говоря к цифровым извращениям испытываю большую тягу чем к аналоговым :)

                                      Суть в другом, вот что мы сделали:
                                      1. Поставили более дорогой ЦАП (с повышенной частотой дискретизации и разрядностью)
                                      2. За счет придумывания(интерполирования) отсутствующих семплов на шкале времени CD — увеличили кол-во воспроизводимых семплов.

                                      Но зачем?
                                      Ведь увеличение интерполированных точек, повышение частоты дискретизации и разрядности на ЦАП не влияет на качество звука ВОСПРИНИМАЕМОЕ ЧЕЛОВЕКОМ, ибо ЦАП(16бит, 44.1 КГц) достаточно и даже с большим запасом.

                                      Получается все эти «улучшения качества» с точки зрения человека воспроизводящего звук с CD — не более чем маркетинговый трюк…
                                        +1
                                        Человек написал 2 статьи, объяснил, разжевал — и опять те же вопросы…
                                        Суть увеличения частоты дискретизации — замена дорогого, сложного, крупногабаритного аналогового ФНЧ высоких порядков (да еще с плохой ФЧХ) на связку простого и дешевого цифрового + простого и дешевого аналогового низкого порядка. Вот и все.

                                        И улучшение качества в данном случае — это не улучшение исходного звука, это улучшение приближения звука на выходе системы к исходному.
                                          +1
                                          Я писал о том, что:

                                          1. Замена существующего оборудования имеющего ЦАП(16бит, 44.1 КГц) на оборудование с ЦАП имеющем повышенною частоту дискретизации и разрядности — не имеет смысла, так как разницы человек не услышит.

                                          2. И так же думаю, что
                                          замена РАБОТАЮЩЕГО дорогого, сложного, крупногабаритного аналогового ФНЧ высоких порядков (да еще с плохой ФЧХ) на связку простого и дешевого цифрового + простого и дешевого аналогового низкого порядка — не имеет смысла, если все паразитные шумы лежат за пределами человеческого уха.

                                          Вот и всё :)

                                          «И улучшение качества в данном случае — это не улучшение исходного звука, это улучшение приближения звука на выходе системы к исходному.»
                                          — Поймите, в этом приближении нет смысла, если человек разницы почувствовать не может.

                                          На графиках, всегда рисуют оцифрованный звук большими некрасивыми ступеньками, даже автор данной статьи прибегает к этому приему ;-)
                                          Причем, после добавления промежуточных точек, график якобы становится «красивее» и ближе к оригинальному сигналу. Но, если мы увеличим масштаб раз в 10, то произойдет чудо… через те же самые дополнительные точки, которые красиво приближались к исходному сигналу, опять будут проходить большие некрасивые ступеньки, очень далекие от оригинального сигнала… И такое приближение можно делать до бесконечности опять добавляя промежуточных точек… Но зачем???

                                          Смысл в том, что имея CD-проигрыватель с ЦАП(16бит, 44.1 КГц) человек смотрит на ступеньки с такого далекого расстояния и запасом, что ни одной мало мальски некрасивой ступеньки выступающей от оригинального сигнала увидеть не сможет при всем желании.
                                          Я могу привести аналогию с TV. Сейчас становится модным формат 4K — и это хорошо, отличие от FullHD на глаз мало, но ЗАМЕТНО. Т.е. в 4К человек четко может сказать, что картинка лучше. Это всё почему?, потому, что по оценкам разных специалистов разрешение человеческого зрения около 50К — 100К. Так вот, когда появится телевизор с разрешением 200К, то тогда можно сказать, что это равносильно тому, что сейчас используется при воспроизведении с CD-проигрывателя с ЦАП(16бит, 44.1 КГц).

                                          Те кто считает, что сравнивать разрядность/дискретизацию звука АЦП/ЦАП и чувствительностью человеческого уха нельзя, равно как разрешение для человеческого глаза — в общем смысле ошибаются. Да, напрямую нельзя, т.к. у человеческих органов есть своя специфика и не линейность чувствительности в разных зонах. Но грубо/приблизительно, привести к общему знаменателю и сравнить можно, а когда при сравнении мы видим более чем двух кратное превосходство, то можно уже делать выводы.

                                            0
                                            Простите, а где автор пишет о замене работающих аналоговых фильтров?
                                            Подозреваю, что аппаратура с такими фильтрами находится либо в чуланах, либо у самых упоротых пользователей.
                                            Сейчас подавляющее большинство (99 и не знаю сколько еще девяток после запятой %) делается именно так, как описано в статье. Хотя бы потому что это проще, лучше, стабильнее и дешевле.
                                            Исторический экскурс так сказать.
                                              0
                                              Автор не пишет. То, что их нет смысла менять, это как раз мое мнение, подкрепленное после небольшого погружения в суть передискретизации и улучшения качества звука, о которых идет речь в статье.
                                                0
                                                Их есть смысл менять хотя бы с точки зрения доступности аппаратуры и стабильности ее характеристик.
                                                Параметры цифрового фильтра абсолютно стабильны, он не нуждается в настройке, крайне дешев.
                                                Параметры аналогового фильтра в системе с цифровым некритичны, он прост, и дешев.

                                                В системе с аналоговым фильтром высоких порядков фильтр дорог, его параметры меняются в зависимости от температуры и со временем.

                                                Так что даже если при выходе с производства обе системы будут иметь сравнимое качество звука (что уже объективно невозможно в связи с плохой ФЧХ полностью аналоговой системы), то со временем аналоговая будет звучать только хуже.

                                                Какой смысл сохранять значительно более дорогую, объемную, тяжелую и нестабильную систему кроме «ятакхочу»?
                                                  0
                                                  Я уже писал об этом несколько раз.
                                                  Смысл в том, что если дорогая старая техника работает и претензий у пользователя к качеству звука нет, то поддаваться на маркетинговые уловки и выкидывать деньги на ветер не надо. На новой технике услышать «лучший» звук не получится.

                                                  Поймите, все эти «доступность аппаратуры», «стабильность характеристик», «ФЧХ»… всё это пыль, если итоговое качество звука СЛЫШИМОГО человеком — его устраивает. Если от температуры или от времени, параметры фильтра меняются, но я этого не могу услышать, то для меня они роли не играют. Если же старая аппаратура работает плохо и постоянно приходится ее перенастраивать, чтобы бороться с шумами и помехами, то конечно ее надо менять, с этим никто не спорит.
                                                    0
                                                    Да сколько уже можно?
                                                    Где, в каком именно предложении автор предлагает хоть кому-то менять свой старый хлам, который его устраивает, на что-то новое??? Если кого-то устраивает патефон, то никаких проблем.

                                                    Это не маркетинговые уловки. Это всего лишь описание того как менялась техника. Было так-то, стало так-то. произошло это вот поэтому и вот поэтому. Все. ТОЧКА.
                                                      +1
                                                      Знаете, у вас происходит либо кратковременное отключение памяти, либо вам просто нравится задавать один и тот же вопрос по 1000 раз… https://geektimes.ru/post/284300/#comment_9795036
                                                      Давайте на этом уже закончим.
                                                        –1
                                                        С памятью у меня все хорошо.
                                                        Это у вас некоторые проблемы с пониманием написанного. В частности, с понятием контекста.

                                                        Там где я писал «Их есть смысл менять» речь шла о производстве, а не в старых патефонах, устраивающих своих владельцев.
                                                        Как собственно и произошло.
                                          +1
                                          Для этого просто надо взяв за исходную амплитуду 0.1 Дб посчитать сколько дискретных «точек» человек может распознать до 130Дб, с увеличением каждой следующей «точки» на 10%.
                                          В итоге получилось 78 точек, что соответствует 7битам с большим запасом (50 точек). Т.е. вот при таком грубом расчете с запасом, мы приходим к выводу, что для оцифровки и воспроизведения звука без потери качества (с точки зрения человеческого уха) достаточно 7*2=14 бит для шкалы амплитуды.

                                          Это всего лишь означает, что для плавной (т.е когда человек не различает ступеньки) регулировки громкости достаточно 14 бит. Какое это имеет отношение к квантованию собственно сигнала?

                                          а кто-нибудь знает сколько разрядов может различать человеческое ухо? ;)

                                          Ухо вообще по другому работает. Там термин «разрядность» неприменим.

                                            0
                                            «Какое это имеет отношение к квантованию собственно сигнала?»
                                            — Я исходил из того, что возможность услышать звук, зависит от его амплитуды. Самый тихий звук который мы можем услышать, характеризуется минимальной амплитудой (которою может чувствовать ухо), и соответственно самый громкий звук — максимальной амплитудой. Отсюда, мы можем определить мин. и макс. амплитуду которую может воспринимать человек, ну и соответственно, зная шаг изменения громкости, можно определить кол-во разрядов на шкале амплитуды для человека. Конечно, это грубо, и эта так сказать моя собственная оценка, если вы хотите более точного определения, можете обратиться к статье приведенной в комментарии выше.

                                            «Ухо вообще по другому работает. Там термин «разрядность» неприменим.»
                                            — На это я тоже ответил чуть выше.
                                            +2
                                            Ещё: "Наиболее неприятные на слух искажения, вносимые на этапе оцифровки — гранулярный
                                            шум
                                            , возникающий при квантовании сигнала по уровню из-за округления амплитуды до ближайшего дискретного значения. Гранулярный шум сильно связан с
                                            сигналом (зависит от него), и представляет собой гармоники сигнала, искажения от которых наиболее заметны в верхней части спектра. Проявления гранулярного
                                            шума и его связь с сигналом легко заметить, прослушав синусоидальный сигнал с частотой около 0.1..5 Гц — гранулярный шум в этом случае проявляется в виде
                                            изменяющегося по высоте паразитного тона, частота которого зависит от частоты, формы и максимальной амплитуды полезного сигнала.

                                            Мощность гранулярного шума обратно пропорциональна количеству ступеней квантования, однако из-за логарифмической характеристики слуха при линейном квантовании (постоянная величина ступени) на тихие звуки приходится меньше ступеней квантования, чем на громкие, и в результате основная плотность нелинейных искажений
                                            приходится на область тихих звуков. Это приводит к ограничению динамического диапазона, который в идеале (без учета гармонических искажений) был бы равен
                                            соотношению сигнал/шум, однако, необходимость ограничения этих искажений снижает динамический диапазон для 16-разрядного кодирования до 50-60 дБ."


                                            Не все шумы и искажения, равные по амплитудному (процентному) соотношению будут равны по восприятию человеческим ухом. Почитайте статью. Учитывая дешевизну реализации ЦАПов с высокой разрядноситью, проще и дешевле просто свести уровень искажений, связанных с квантованием, до пренебрежимо малых величин и не мучаться. Нет никакого заговора. Это просто самое простое и эффективное решение проблемы с шумом квантования/гранулярным шумом на данный момент.
                                            0
                                            Вы (автор), как всегда правильно написали фразу «для периодического».
                                            Сложность заключается в том, что музыка — это совсем не всегда периодический процесс.
                                            Посему и любая попытка интерполяции улучшает объективные параметры и ухудшает собственно воспроизведение музыки.
                                              0
                                              Это уже не лечится.
                                              Специально для людей, с такой точкой зрения написал целую статью где всё уже разжованно с картинками для уровня восприятия дошкольника.
                                              Любая оцифровка коверкает звук.
                                              Оцифрованный звук — это близко не исходный звук и хорошая интепорляция его только улучшает.
                                              Без интеполяции запись с битрейтом CD вообще слушать невозможно.


                                              Посему и любая попытка интерполяции улучшает объективные параметры и ухудшает собственно воспроизведение музыки.

                                              Подобная точка может существовать, но если сказали А, надо говорить уже и B.
                                              Слушать музыку необходимо только вживую, причём музыканты не должны пользоваться усилительной аппаратурой.
                                                0
                                                Если честно, то на «живых» концертах зачастую качество музыки бывает таким, что лучше с айфона MP3 слушать!
                                                Аналоговая запись тоже не обходится без искажений.
                                                На магнитную ленту пишут с подмагничиванием, что приближает запись к цифре, ну а для записи на винил сигнал предварительно серьёзным образом искажают и компрессируют.
                                                Прослушивание же живых артистов в специальной студии не каждый миллиардер себе позволить может.
                                                  0
                                                  Оцифрованный звук — это близко не исходный звук

                                                  В данном случае, некорректное утверждение. Дискретизация (этот термин уместнее — видите, переходим на исходный английский и становится проще?) — это всего лишь способ зафиксировать процесс. Как его восстановить из записи — вот вопрос.
                                                  хорошая интепорляция его только улучшает.
                                                  Еще можно сравнить с кино, 24 кадра в секунду типо достаточно для глаза, хотя на движущихся картинках нечеткость и смазанность очевидна. Когда появились достаточно доступные видеопроекторы бОльшего разрешения, чем 640х480, тоже стало очевидным, что из стандарта DVD бОльшее количество пикселей получить сложно. Точнее, интерполировать-то никаких проблем, картинка выходила гладкая, но, бестолковая — очевидно, деталей на ней не прибавлялось — потому как неоткуда им было взяться.
                                                    0
                                                    Сравнить с кино нельзя, вы так и не поняли сути написанного. В данном случае интерполяция не предназначена для увеличения «детальности» звука, она предназначена именно для более достоверного его воспроизведения более простыми средствами.
                                                      0
                                                      Это Вы как раз перепутали апсэмплинг с оверсэмплингом.
                                                      Тупое добавление нулей ничего не делает сисходником, а вот интерполяция — делает.
                                                        +1
                                                        Нет, это вы перепутали апскейлинг (в ТВ) с апсэмплингом.
                                                        Да, есть интерполяция, которая искажает цифровой исходник с CD. Но нам, вообще говоря, абсолютно безразлично какие именно цифровые преобразования претерпевает сигнал. Нам важно, чтобы окончательный аналоговый сигнал на выходе усилителя как можно точнее повторял сигнал до оцифровки. Апсэмплинг не пытается добавлять никаких аналоговых «деталей» (в отличие от апскейлинга видеосигнала), его цель именно максимально приблизить форму выходного аналогового сигнала (после DAC и фильтров) ко входному (до ADC). Поскольку суммарная АЧХ цифрового и аналогового фильтров такова, что частоты, проходящие через него не превышают 44,1 кГц пополам, то никаких аналоговых «деталей» к звуку добавиться не может. Он делает то же самое, что и аналоговый фильтр без апсэмплинга, но дешевле, компактнее и без лишних фазовых искажений.
                                                        0
                                                        Сравнить с кино как раз возможно и это даже забавно:
                                                        "24 кадра в секунду типо достаточно" для создания иллюзии непрерывного движения да, но мерцание с частотой 24Hz вы себе представляете? Это-же жесть, заметная даже упоротому транквилизаторами мозгу.
                                                        По этому в кино проекционном аппарате есть такая хренька — обтюратор, с двумя или тремя лепестками, которая во время экспозиции кадра, перекрывает световой поток, умножая частоту мерцания на 2 или 3!
                                                        В таком виде, кино смотреть в разы приятней, ибо частота мерцания оказывается за гранью восприятия.

                                                        PS.А что-бы не было смазывания, в киносъёмочном аппарате так-же был обтюратор, но более хитрый, сменный или настраиваемый, дабы сократить время экспозиции, ибо 1\24 секунды, это как бы дофига.
                                                          0
                                                          Сравнивать с кино нельзя. Обтюратор не имеет отношения ни к интерполяции ни к фильтрации. Аналогии должны быть уместными.
                                                            0
                                                            Он имеет отношение к умножению частоты! А интерполяцией дискретных значений освещённости занимается зрительный анализатор, в итоге получается фильтр…
                                                            Но вы правы, приводить пример из области оперирующей пространственными частотами, там где люди с одномерным рядом разобраться не могут, действительно не уместно…
                                                              0
                                                              К увеличению частоты мерцания. При этом информация содержащаяся в каждом кадре не умножается, и вообще никак не изменяется. В отличие от ресэмплинга. Поэтому аналогия неуместная.
                                                            0
                                                            обтюратор, с двумя или тремя лепестками, которая во время экспозиции кадра, перекрывает световой поток, умножая частоту мерцания на 2 или 3!
                                                            В таком виде, кино смотреть в разы приятней, ибо частота мерцания оказывается за гранью восприятия.

                                                            Спасибо, именно эта аналогия ближе всего к процессу добавления нулей.
                                                        0
                                                        Без интеполяции запись с битрейтом CD вообще слушать невозможно

                                                        Вроде только то рассказали, что выходной фильтр нужен для того, чтоб не мучать усилитель ужосами, а не для того, чтоб уху лучше было.
                                                        Без фильтра и передискретизации в первую очередь страдает ВЧ область. Да, мы привыкли к перидискретизированному звуку, к «хрустальному», «воздушному» и т.д. Но это всего лишь звуковые эффекты, ненужные для восприятия музыки. Тот же стандарт LP был не очень-то и богат на ВЧ, а конусные ВЧ-динамики почти не воспроизводили выше 15-16кГц. Да и выходные трансформаторы не очень-то высоко играли. Так что просто мы привыкли за последние 20-30 лет к звону «высоких», а другого ХОРОШЕГО звука в СССР было почти и некому услышать.
                                                        Подытоживая — без передискретизации вполне даже слушабельно, если не искать звуковых спецэффектов.
                                                        Другое дело, что обычная аппаратура (кремниевый усилитель с ООС) будет работать с выходом ЦАПа без фильтра откровенно плохо.
                                                          +2
                                                          Наверно да. Если подключить ЦАП к ламповому усилителю, который нагружен на акустику с потолком в 16 кГц — то можно обойтись.

                                                          А если аудиотракт типа этого, и слушается всё через мониторные наушники: «Швейцарская компания Nagra выпустила в продажу цифро-аналоговый преобразователь Classic DAC. Новинка представляет собой более доступную версию модели HD DAC и отличается от неё отсутствием регулятора громкости и усилителя для наушников, а также несколько изменённой аналоговой секцией. В последней используется по 9 тщательно подобранных транзисторов на канал, а отношение сигнал/шум (невзвешенное) выходного каскада достигает 145 дБ,» — то придётся и ЦАП ставить соответствующий. Другое дело, что рядовому гражданину для прослушивания русскава рэпа это не нужно.
                                                          Это же как прон в 4К. Не каждый найдёт удовольствие в разглядывании прыщиков на теле актрис и качестве бритья ;-). То ли дело VHS и кинескопный телек.
                                                            0
                                                            выходной фильтр нужен для того, чтоб не мучать усилитель ужосами, а не для того, чтоб уху лучше было.

                                                            Если мучить ужосами усилитель, то хуже станет не только ему, но и уху. Даже если эти ужосы на ультразвуковых частотах. Если хорошенько перегрузим усилитель ультразвуковым сигналом, то получившиеся интермоды залезут в слышимый диапазон и испортят не только ВЧ, но и СЧ, а то и НЧ, если повезёт.

                                                          0
                                                          В аудиоплеерах часто есть кнопочка, которая позволяет зациклить любую музыку. И вообще практика говорит, что теорема прекрасно применяется на практике: https://geektimes.ru/post/246728/
                                                            0
                                                            С одной оговоркой. Трудно найти компьютер, который не развалится от времени, пока будет обсчитывать восстановление музыкального фрагмента в несколько минут целиком. Если этот процесс вообще завершится до конца существования вселенной.
                                                          0
                                                          Ещё в пользу повышения разрядности. Давайте отвлечёмся от нашего синуса на 20 кГц и перейдём к реальной музыке.
                                                          Итак:
                                                          Звучащий симфонический оркестр обладает динамическим диапазоном свыше 90дБ


                                                          Пусть мы используем весь динамический диапазон нашего 16 бит ЦАП. Тогда самый тихий звук оркестра будет -90 дБ от размаха. На него останется 6 дБ динамического диапазона а это...1 бит! Дада. самый тихий (но различимый) звук будет воспроизведён меандром ;-) А учитывая, что в симфонической музыке есть как громкие места так и тихие, то в тихих местах этот меандр будет прекрасно слышен. Ибо его просто нечему будет маскировать.
                                                            0
                                                            Вот только придётся задрать громкость усилителя, чтобы искажения не замаскировались окружающим шумом. Но даже для любителей крутить ручки усилителя придумали хитрое подмешивание шума.
                                                              +1
                                                              хитрое подмешивание шума.
                                                              А сейчас, в силу дешевизны, используют лобовое решение: 24бит/192 кГц (или выше). И проблема с дискретизацией/квантованием уходит на дальний план и можно сосредоточиться на качественной аналоговой части типа 9 транзисторов и с/ш 145 дБ ;-)
                                                                0
                                                                В случае 24 битного сигнала такой частоты оцифровки скорее всего будет достаточно простейшего фильтра. Но речь в статье идёт о том, как с приемлимым качеством можно слушать обычные CD
                                                              0
                                                              Посмотрите на картинки. На выходе ЦАП не меандр сколько же можно это повторять!!!! а прямоугольные ступеньки!
                                                              Именно для того чтобы сгладить форму этих ступенек и используется передискретизация!!!
                                                                0
                                                                Если исходный цифровой сигнал меняется периодически только в младшем значащем разряде — то меандр ;-). Ну если отцентровать — то да — что-то типа имитации синуса на самом дешёвом бесперебойнике. Лучше от этого не станет.

                                                                Речь то идёт о том, что надо воспроизводить не просто синус большой амплитуды. А реальный сигнал с динамическим диапазоном, практически перекрывающим динамический диапазон 16-битного ЦАП.
                                                                  +1
                                                                  Как-то так будет выглядеть сумма очень тихих чистых тонов Местами вполне менандр ;-)

                                                                  image
                                                                    +2
                                                                    Хотите увидеть ступенчатые сигналы?
                                                                    Итак: частота равна 1/10 от частоты дискретизации. Разрешение 16 бит. Идеальных, ибо кирпичик labView
                                                                    image

                                                                    А вот те же условия, но частота сигнала 0,5 от частоты дискретизации.
                                                                    image
                                                                    Меандр однако. При любой разрядности будет меандр :-)
                                                                  0

                                                                  В статье человек делал фильтр Бесселя 10го порядка
                                                                  http://service4u.narod.ru/html/filter.html

                                                                    +1
                                                                    Я охотно верю, что можно сделать. Только это нужно на данном этапе примерно как троллейбус из буханки хлеба. Разве что маркетологи если раскрутят в узких кругах любителей первых «параллельных» (а скорее всего R-2R) ЦАПов ;-)
                                                                      0
                                                                      Ещё аргумент: берём входной сигнал не 1 кГц а 20кГц. Так вот — без фильтрации при частоте дискретизации 44.1 у него образуется брат-близнец на частоте 24,1 с равной амплитудой. И спокойно пройдет через фильтр Бесселя 10го порядка. Ибо относительная разница в частотах равна 1,2. А фильтры Чебышева и Баттерворта по вполне логичным мотивам автором указанной вами статьи были были забракованы.
                                                                        +1
                                                                        Да я вообще за цифру и за 24 бита @ 192 КГц;)
                                                                        Вот только я не слышу выше ~18 КГц((
                                                                          0
                                                                          Зато при плохом раскладе прекрасно услышите 24,1-20=4,1 кГц. Причём ухо его быстро отловит как чужеродный тон.
                                                                            +1

                                                                            А "плохой расклад" в данном случае — наличие хотя бы небольшой нелинейности в тракте?

                                                                              0
                                                                              Да. И на высоких частотах нелинейность тракта обычно растёт.
                                                                                0

                                                                                Ограниченная скорость нарастания выходного напряжения? (Я не настоящий сварщик, так что вопросы, наверное, детские)

                                                                                  0
                                                                                  Одна из основных причин — уменьшение глубины отрицательной обратной связи.
                                                                                  Далее — просто сама схемотехника (разводка, выбор элементов) может быть не адекватна для нормальной работы с высокими частотами, ибо делалась под ЗЧ.
                                                                                  А если УЗЧ класса D. То там вообще могут повылезти комбинационные частоты частоты дискретизации и частоты ШИМ.
                                                                              0
                                                                              Иллюстрация «биений» при частоте сигнала 0,49 от частоты дискретизации:
                                                                              image
                                                                              Можно воспринимать как результат интерференции частоты тона и её «зеркальной» частоты. А можно понять как своего рода «стробоскопический» эффект.
                                                                              Можно воспроизвести, нарисовав синус и делая дискретизацию руками и карандашём ;-)
                                                                                0
                                                                                В радиотехнике данный результат часто называют «нулевыми биениями»
                                                                                0

                                                                                Не переживайте, я не буду собирать фильтр Бесселя;)

                                                                                  +1
                                                                                  Я не переживаю. Я накидал в ЛабВью аудиотракт с блэкджеком… с генератором сигнала, ацп, цапом и ресэмплером и теперь радуюсь. Вы просто вопросы задаёте подходящие ;-)
                                                                                  Итак. Маленькое чудо:
                                                                                  Что мы имеем изначально. Сигнал с частотой 0,45 от частоты дискретизации:
                                                                                  загрузить изображение

                                                                                  А теперь делаем ресэмплинг 10х и фильтрацию
                                                                                  хостинг для картинок

                                                                                  Никаких биений! Кстати — если просто соединять точки сплайнами а потом ресемплировать — то биения не уйдут.
                                                                                    0
                                                                                    Спасибо. Отличный пример! Надеюсь автор не будет против если я добавлю его в мою статью?
                                                                                      0
                                                                                      и ИМХО стоит добавить физико\математический ликбез, ибо для многих не разу не очевидны преобразования частоты, отсюда и дебильные вопросы.
                                                                                        0
                                                                                        Скорее уже математический, но это задача скорее для zerg59, пока не закончились праздники он мог бы написать замечательную статью по этому поводу.
                                                                                        Я всё таки больше по области hardware чем математики.
                                                                                        Впрочем профессиональных спорщиков из этого форума никакой теорией не прошибёшь. Какие формулы не приводи, что не рисуй они просто слушают исключительно сами себя.
                                                                                          0
                                                                                          Есть на мой взгляд вполне хороший ликбез на хабре
                                                                                        +1
                                                                                        Не против.
                                                                            –3

                                                                            я не согласен с тем что мастеринг делается на 16х44 щас даже самая нищая домашняя студия мастерит на 24х192. также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц. можете проверить взять песнь какогонибудь тенора пожать её семпл до 2кгц потом обратно растянуть до 44 и послушать. реально при прослушивании СД все что выше 8кгц давольно лживо звучит, а выше 16 скорее шум. слаа богу есть формат 24х192 к которому у меня нет притензий в плане достоверности ВЧ.

                                                                              0
                                                                              А разве кто нибудь спорит?
                                                                              Но ещё очень многие слушают СD, и подавляющее количество звуковых карт даже в персональных компьютерах до сих пор 16 битные!
                                                                                +2
                                                                                также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц
                                                                                Также вы можете не соглашаться с тем, что Земля сферическая и обращается вокруг Солнца. Однако это никак не мешает именно Солнцу быть центром масс Солнечной системы.

                                                                                взять песнь какогонибудь тенора пожать её семпл до 2кгц потом обратно растянуть до 44 и послушать
                                                                                Хороший метод, Одобряю.Взять самолет, переехать бульдозером, а потом заявить «аппараты тяжелее воздуха летать не могут».
                                                                                  +1
                                                                                  также я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц.

                                                                                  20/44=0.4545 Пример восстановления с картинкой в сообщении выше.
                                                                                    +1
                                                                                    А я вот взял и проверил, как 44100 жутко корёжит выше 8 кГц: https://geektimes.ru/post/246728/
                                                                                    Вы тоже можете проверить :-)
                                                                                      0
                                                                                      Так у вас некорректно сравнение сделано.
                                                                                        0
                                                                                        Взял исходник 192 кГц, удалил фильтром частоты выше 20 кГц, сконвертировал в 44100 и обратно в 192000. Вычел результат с двойным ресемплингом из исходника с фильтром, и получил разницу. Где ошибка?
                                                                                          0
                                                                                          В исходнике, который по всей видимости ничего выше 20 кГц и не содержал…
                                                                                          Возьмите какую-нибудь библиотечную литавру или сами оцифруйте гитару со стальными струнами, и будет результат.
                                                                                            +1
                                                                                            А скриншот программы со спектром я для кого делал?
                                                                                            Я статью давно писал, но до сих пор никто не привёл пример аудиозаписи, в которой после таких манипуляций что-то портится до 20 кГц.
                                                                                              0
                                                                                              похоже содержал, но ВЧ был убит примененным фильтром
                                                                                              0
                                                                                              Ошибка в постановке задачи, что вы делаете, как вы это делаете, и в интерпретации результатов.

                                                                                              Если задача показать, что для 20кГц не нужно 192кГц — так это Котельников/Шеннон/Найквист давно доказали.
                                                                                              Если задача показать, что человек не слышит выше 20 кГц — так это надо фокус-группу собирать и двойное слепое прослушивание устраивать.
                                                                                              Если задача показать, что в HD-записях нет частот выше 20 кГц — так их фильтровать не надо и собрать достаточное количество записей для репрезентативного анализа.
                                                                                              Если задача показать несовершенство алгоритма передискретизации в конкретно взятом аудио-редакторе — так надо его импульсную характеристику анализировать, а не какую-то конкретную аудиозапись.
                                                                                                –1
                                                                                                Котельников/Шеннон/Найквист давно доказали только математикам и людям, доверяющим науке. Для других людей совсем не очевидно, что 44100 достаточно, чтобы не терялась информация о высоких частотах. Цитирую комментарий, на который я изначально отвечал: «я не согласен с тем что можно достоверно передать частоту 20кгц дискретизацией 44кгц».
                                                                                                  0
                                                                                                  Люди, не доверяющие Котельникову, даже не пытались почитать его работу. Иначе очень быстро бы выяснилось, что их недоверие вступает в конфликт с объективной реальностью, в которой имеет место быть теле- и радио-вещание.
                                                                                          0
                                                                                          щас даже самая нищая домашняя студия мастерит на 24х192.

                                                                                          тут такая же история как и с мегапикселями в мылницах и 700 Ваттах звука в аудиоцентре за 10 тыс деревянных.
                                                                                          На китайской коробке могут быть написаны любые цифры, там даже изредка могут стоять приличные микросхемы, но при этом одной только «грамотной» трассировкой можно так испортить звук не говоря уже о питании, дискретных компонентах и звенящих фильтрах, что 16 битный CD будет много более качественный сигнал выдавать.
                                                                                          0
                                                                                          Пока санитары не смотрят, позволю себе напомить:
                                                                                          1. Задача ЦАП выдать не оригинальный сигнал, а сигнал неотличимый от оригинального на слух.
                                                                                          2. Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц и точностью дискретизации в 5 бит.

                                                                                            –1
                                                                                            Отсыпь травы брат :-)
                                                                                            Если уж сравнивать, что человеческое ухо, это преобразователь импеданса, с АРУ и нелинейностями, и до фига полосный анализатор спектра, причём каждая полоса охвачена АРУ, срабатывание которого порождает импульс в соответствующем канале, далее уже мозг, но там всё ещё веселей…
                                                                                            … и да, мы знаем об этом достаточно много, что бы кодировать звук для кохлеарных имплантатов, или создавать иллюзию баса в наушниках, или чистый-прозрачный звук в мутной трансляционной сети, это всё психоаккустика называется
                                                                                              0
                                                                                              Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц и точностью дискретизации в 5 бит.


                                                                                              Ознакомьтесь, пожалуйста, с литературой (в гуголе легко находится электронный вариант):
                                                                                              Цвикер Э., Фельдкеллер Р. Ухо как приемник информации
                                                                                                0
                                                                                                Извините, не не ознакомлюсь. У меня есть дела по интереснее, чем читать 7 мегабайт текста только для того, чтобы возможно понять в чём заключается ваше возражение.
                                                                                                  +2
                                                                                                  У меня есть дела по интереснее

                                                                                                  У меня тоже есть дела по интереснее, чем разжёвывать лентяям основы психоакустики ;-). Идите с миром… ;-)
                                                                                                    –2
                                                                                                    Имейте ввиду, что позиция «вы не догадаетесь, с чем я несогласен, пока не прочитаете вон тот талмуд» не делает вас умнее в глазах окружающих.
                                                                                                      0
                                                                                                      Ежу понятно — с 5 битами.
                                                                                                        0
                                                                                                        У вас другие данные?
                                                                                                          0
                                                                                                          Возьмите любой звуковой редактор, который умеет преобразовывать квантизацию к 5 битам и проверьте своими ушами.
                                                                                                            0
                                                                                                            Вот возьмите и проверьте, только имейте ввиду эффект маскировки, не позволяющий нам единовременно воспринимать весь доступный нам динамический диапазон громкостей.
                                                                                                              0
                                                                                                              Если б я не проверял — я бы не писал изначальный комментарий.
                                                                                                                0
                                                                                                                Отлично, значит вам не составит труда выложить результаты проверки.
                                                                                                                  0
                                                                                                                  Отлично, что-то ляпнули — а проверяют пусть бугуртящие. Это дух эксперимента, это научный подход.
                                                                                                                    0
                                                                                                                    Вы же уже проверили. Почему скрываете результаты?
                                                                                                                0
                                                                                                                При 5 битах, динамический диапазон был бы около 30 дБ. Вы заявляете, что динам. диапазон человеческого слуха 30 дБ?
                                                                                                                  0
                                                                                                                  Нет, я такого не говорил.

                                                                                                                  Динамический диапазон уха (если не брать в расчёт разные степени болевых ощущений) — порядка 12 Б или 20 бит.

                                                                                                                  При этом громкость выше 10 Б никто в здравом уме выкручивать не будет. Уровня шумов ниже 3 Б добиться весьма не просто. Так что для записей остаётся лишь 7 Б, что чуть больше 10 бит.

                                                                                                                  Тем не менее при мастеринге звук всё равно компрессируют максимум в 4 Б, что чуть больше чем 6 бит. Но как правило жмут ещё сильнее, вплоть до 0,4 Б (ага, меньше бита на отсчёт).

                                                                                                                  Это всё, чтобы понимать масштаб трагедии — 90% населению планеты более чем достаточно 6 бит на отсчёт.

                                                                                                                  Почему? Да потому, что из-за эффекта маскировки звуки на 3 Б (или в 8 раз) тише от самого громкого в критической полосе уже не слышны. Для примера, можете попробовать, прошептать что-нибудь активно разговаривающим собеседникам находясь в метре от них. Услышат ли они вас?
                                                                                                                    0
                                                                                                                    Простите, а что это за такая единица измерения «Б»?
                                                                                                                      0
                                                                                                                      https://ru.wikipedia.org/wiki/Бел
                                                                                                                        0
                                                                                                                        Ок, хотя я привык к дБ, а вообще речь наверное про дБА, ну да бог с Вами.

                                                                                                                        2. Человеческое ухо — АЦП с частотой дискретизиции в 20 КГц...


                                                                                                                        Возможно Вы хотели написать 40 КГц? А иначе люди бы не слышали звуки выше 10 КГц.

                                                                                                                        … и точностью дискретизации в 5 бит.


                                                                                                                        Это «работает» только для однотонального сигнала (в отсутствии других звуков или шумов).
                                                                                                                        Могу объяснить почему.

                                                                                                                          0
                                                                                                                          Теорема котельникова тут не работает, так как ухо фиксирует мгновенное ачх и восстановлением исходного сигнала не занимается.

                                                                                                                          Оно для любых сигналов работает, на чём и о основано сжатие с потерями. Или у вас другие данные?
                                                                                                0
                                                                                                и точностью дискретизации в 5 бит.

                                                                                                Откуда у вас такая информация?
                                                                                                  +1
                                                                                                  Отсюда: https://geektimes.ru/company/audiomania/blog/246304/
                                                                                                    0
                                                                                                    аудиомания это наше всё
                                                                                                      +1
                                                                                                      За что купил — за то продал. У вас есть более авторитетная информация?
                                                                                                  0
                                                                                                  0
                                                                                                  Угу. Неравномерности АЧХ в 4-м знаке после запятой в логарифмической шкале ;-)
                                                                                                  Тут где-то товарищ приводил порог различимости разных уровней громкости. Там было ЕМНИП 1 дБ.
                                                                                                  Т.е. искажения АЧХ даже в самом пплохом случае на 4 порядка по величине меньше чувствительности человеческого уха.
                                                                                                  Искажения АЧХ — линейные искажения. А их человеческое ухо воспринимает очень лояльно.

                                                                                                  И пик в 0,0001 дБ,
                                                                                                  а это в разах будет 1.00001, т е повышение амплитуды в 0,001%. Аналоговую часть это тоже не перегрузит.

                                                                                                  И кстати да — там хорошие картинки насчёт разрядности и шума квантования.

                                                                                                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                                                                  Самое читаемое