
Комментарии 94
что преобразование из 192000 Гц в 44100 Гц является сжатием без потерь— я бы лучше сказал, что такое преобразование не внесёт в звук значительных искажений.
Частоты выше 20 КГц — это не ультразвук, а тонкие детали волнового профиля.
Частоты выше 20 КГц — это не ультразвук, а тонкие детали волнового профиля.
Которые вы никогда не услышите.
Я сам себя аудиофилом не считаю, по моему мнению частота свыше 44 или 48 КГц в звуковых файлах для прослушивания — это излишество, но что касается записи и обработки — здесь и высокая частота и разрядность 24 или 32 бита вполне оправданы.
Обрезал высокие частоты, а потом проверил, что их нет :)
Надо было сделать так:
1. Записываешь звук на «высокой» частоте с реального источника.
2. Из него методом выборки каждого N-ного сэмпла делаешь файл на «традиционной» частоте.
3. (собственно, в этом — суть проверки) проигрываешь два файла через одну и ту же систему (а туда входит ЦАП + динамик/наушник) и уже там пытаешься анализировать разницу — либо ухом либо инструментально.
От себя добавлю что ещё не видел ни одной системы воспроизведения звука чтобы я перепутал записанную музыку с живой.
Наверно, это были записи недостаточно хорошего качества или не очень хорошие колонки ;)
Честно говоря, мне и самому интересно убедиться в том, что «44 КГц достаточно всем».
Прежде чем ударяться в тонкости измерений, хотелось бы для начала обмануться самому на тему «ух ты, а я думал, это — живая музыка». После этого было бы, что обсуждать.
А например классическай музыка, в идеале, должна вообще одинаково звучать.
Если взять отдельно звук ударных или смычковых инструментов — он живой очень хорошо слышен.
Целью всего этого было показать, что в файлах 44100 Гц и 192000 Гц содержится одинаковое количество информации о звуке, т.е. при преобразовании в 44100 не теряется ничего, если не считать погрешностей ниже -96 дБ, которые никто не услышит. Вы не путаете частоту дискретизации со звуковым диапазоном?
Что касается реалистичности, то по-хорошему звуковая техника должна была шагать в сторону формирования определённого пространственного расположения звуковых колебаний в точке, где находится слушатель (куча датчиков, сложная математика с компенсацией влияния помещения). Но маркетинг взял верх, и начали тупо штамповать ЦАП и АЦП с высокими частотами дискретизации, делая вид, что это какое-то новый этап в повышении качества.
Для проверки, на сколько там реально используется теорема Котельникова и на сколько там действительно жёсткая математика, можно сгенерить в 21990*10 Гц синусоиду, преобразовать её в 22000 Гц и потом попробовать восстановить? Там должны получиться биения — это непростой случай.
Я далёк от современных разработок звуковых систем, но не ужели там ЦАПы уже на столько мощные чтобы в реальном времени считать свёртки и восстанавливать такие сигналы?
Тут же вопрос, мне кажется, не столько в теоретической возможности, а в том, происходит ли это реально в моих наушниках.
Вот например если тупо повысить частоту дискретизации, то никакого интеллекта в ЦАПах вообще не понадобится. Можно будет тупо играть сэмплы подряд. Может быть, в этом смысл?
Современные чипы могут содержать внутри сложную обработку при этом являясь ЦАП-ом т.е. в прямом смысле на входе цифра на выходе аналог.
А уж каким образом там цифра преобразуется в аналог — это принцип черного ящика. Может там черти сидят и потенциометры крутят в зависимости от поступившего на вход кода.
В остальных случаях сигнал МОЖНО восстановить теоретически если предположить что он бесконечный, на практике к этому состоянию можно только приблизиться с заданной точностью, и чем больше точность тем выше величина необходимого отрезка.
Причем, восстанавливать нужно не простой интерполяцией.
Дело в том, что это в уже готовом файле можно просто взять и убрать все высокие частоты. Пока же сигнал аналоговый, мы либо срежем ещё и слышимый звук, либо пропустим часть ультразвука. Чаще всего получается компромисс — и то и другое одновременно.
А что происходит при оцифровке сигнала, содержащего ультразвук, на частоте 44100? Муар. Причём частота этого муара может быть очень низкой.
Самый надёжный способ этого избежать — это взять частоту дискретизации с большим запасом, чтобы аналоговые фильтры могли убрать весь сигнал выше половины частоты дискретизации не задев при этом слышимый диапазон.
В процессе цифровой обработки звука могут возникать всякие артефакты и зачастую — в области высоких частот. Если частота дискретизации взята с запасом в 2-4 раза, то практически все артефакты окажутся в области ультразвука, а от того ни на что не повлияют.
Но конечную запись, конечно, вполне можно делать на 44100 или 48000. Причём последний вариант лучше: большинство аудиокарт не умеют работать напрямую с 44100 и преобразуют их в 48000, при этом опять таки могут возникать артефакты.
1. Шумы, которые появляются после усиления на 96 dB это как раз результат эквалайзера. Но тут есть контр мнение — возможно это из-за недостаточного динамического диапазона файла, например если создать пустой файл некоторой длины и начать в нём увеличивать громкость, то на каком-то этапе у него появятся шумы, которые, фактически, являются (должны являться) белым шумом, пришедшим из ничего (не знаю как это правильно сказать, но такое определение мне нравится). Но 96 dB это как-то мало, белый шум на пустом файле у меня появляется где-то после усиления на 200 dB, может быть дело всё-таки в эквалайзере (а может в разрядности звука).
2. По идее, такой ровный срез на эквалайзере у вас получился как раз из-за высокой частоты. Если бы частота была ниже, это, вероятно, могло вызвать появление искажений на краях диапазона, и они были бы видны при сравнении, но это, опять же, зависит от алгоритма эквалайзера.
Впрочем, оба пункта никак ваши выводы не оспаривают и лишь прозрачно намекают, что обрабатывать (запись, мастеринг, etc) звук как раз желательно в 192 кГц, а делать даунсепмлинг до 44 кГц уже непосредственно перед передачей… эээ… «в продакшн».
22.5кгц будут представлены 2мя дискретными показаниями и форма волны не будет восстановлена так как не понятно там синус или пила или прямоугольный импульс
Пила и прямоугольник имеют бесконечный спектр частот. Они — сумма бесконечного ряда синусоид.
наш мозг не может интерпретировать форму сигнала на вч и ему побарабану, там синус, пила или прямоугольный импульс
Как уже сказано выше, эта самая форма сигнала — это сумма множества синусоид. И все из них, что попадают в слышимый диапазон, важны. Вы легко отличите 5 кГц чистого синуса от пяти тысяч прямоугольных импульсов.
Кстати, 5 тысяч прямоугольных импульсов могут проследовать и с частотой в 100Гц…
На деле 192КГц и 44,1КГц разница будет всегда если в исходном сигнале достаточно много информации, другое дело сможем ли мы её услышать.
Это как с частотой кадров, то что если прогнать в секунду 100 кадров и 400, мы не заметим разницы в обычном состоянии, ещё не значит что там разницы нет, если мы замедлим в 4 раза эти 100 и эти 400, разницу мы заметим (если было произведено снятие чего-то динамичного, быстрого по своей природе, чего требуется передать большим числом снимков).
Вот суть:


Когда я воспроизвожу звук со скорость 0,14-0,18x я слышу разницу, на 0,21х уже нет, но у меня аппаратура довольно дерьмовая и слух наверное уже далеко не самый лучший, да и источник сигнала под сомнением, так что может и на относительном более быстром воспроизведении при должных условиях можно ещё заметить разницу.
Другой вопрос стоит ли эти тонкие детали хранить. Как по мне лучше (если есть возможности) хранить информацию в более точном её представлении, во-первых это может быть полезно для будущей возможной обработки, во-вторых мало ли что мы сейчас не воспринимаем, в будущем ситуация может быть измениться и увы будет восприниматься образно говоря как сейчас видео с ютуба с 30 кадр/сек, только касаемо звука (хотя 44,1КГц это конечно не 30 кадр/сек, если проводить параллели, а вероятно все ~200).
Ну а про воспроизведение звука на 1/5-1/6 от реальной скорости и говорить не приходится: ясное дело, что там нужна в соответствующее число раз более высокая частота дискретизации. Да только лично я ни разу в жизни таким прослушивание не занимался… В отличии от видео, кстати, которое лично регулярно снимаю на 1200 кадров в секунду.
Теория эволюции всё же оперирует настолько большими интервалами времени, что даже если это случится в будущем с человеческим слухом — нынешние записи, даже если сохранятся физически, безнадёжно устареют.
Шаги:
1. Создаём трек с частотой дискретизации 192 КГц
2. Генерим сигнал частотой 21200 Гц
3. Ресемплируем его в 44100 Гц, которых достаточно всем, а больше — не надо, потому что сигнал «можно» восстановить (но кто это делает?)
4. Восстанавливаем частоту дискретизации в 192 КГц. По задумке автора, сигнал должен стать идентичным первому.
Смотрим результат:

Как-то первая и третья волна, на первый взгляд, не совпадают, правда?
Должен ли я сделать вывод о том, что для простых ЦАП, всё-таки, повышение частоты доскретизации — самый простой способ восстановить форму волны?
Ибо без Котельникова и свёрток тут иначе не обойтись.
И я предпочитаю «говорить о вкусе устриц с тем, кто их ел»: в данном случае, с тем, кто хотя бы провёл эксперимент хотя бы на себе.
А ещё возникает пара вопросов:
1. Подростки — это не люди?
2. Слух дегредирует у всех людей одинаково?
3. Если нет, то какой процент людей, старше «подростка», таки слышит 21 КГц?
Впрочем, если вас интересует формальное определение ультразвука, это всё не важно.
Если брать источники, связанны с медициной, то:
«Дети воспринимают звуковые волны в диапазоне от 16 до 20 000 Гц, но приблизительно с 15—20 лет диапазон частотного восприятия начинает суживаться в связи с утратой чувствительности слуховой системы к самым высоким звукам».
meduniver.com/Medical/Physiology/310.html
А в современных ЦАП и так повышается частота дискретизации для возможности использования цифровой фильтрации.
Сигнал — разный, о чём речь? :) Или по картинкам это не очевидно?
Каким образом я что-то показал про фильтры, обрезающие частоты, если я их не применял ни разу?
Фильтры применяют алгоритмы преобразования частоты дискетизации.
Ваш пример лежит выше звукового диапазона, поэтому не вижу смысла его вообще обсуждать в контексте избыточности высоких частот дискретизации для хранения музыки, предназначенной для прослушивания у конечного пользователя.
Вот ЦАП повысил свою внутреннюю частоту и… что он сделал дальше?
Посчитал интегралы и свёртки для восстановления сигнала?
Сразу скажу, что в этом нет ничего невозможного. Современные DSP вполне могли бы с этим справиться. Вполне вероятно, что в профессиональном оборудовании это используется.
Но не в плеерах за 3 копейки, конечно же.
Вот это и называется «можно» восстановить. Весь вопрос — восстанавливается ли сигнал в действительности.
Это исследование показывает, что программа Audacity таким образом сигнал НЕ восстанавливает.
Ок, примем к сведению. Но это ещё не победа и не поражение.
Давайте найдём хоть одну софтину или железяку, которая это делать умеет.
Есть хоть кто-то, кто это «можно» превратил в «делает»?
Цифровому звуку уже больше 50 лет. За это время встраивать DSP в ЦАП, чтобы снизить требования к аналоговым фильтрам, стало обыденным делом. Сейчас ЦАП, производящие цифровую обработку, стоят копейки, например, PCM2704.
Есть у меня плеер Sansa Clip Plus. Подключал к осциллографу и воспроизводил синусоиду 20 кГц — на выходе красивая синусоида без каких-либо кривостей и ступенек. Могу потом записать с него звук на хорошую звуковую с высокой частотой дискретизации и проанализировать его.
Для того, чтобы было «нормально», всё должно сохраняться.
Прекрасно, что синусоида осталась синусоидой. Хорошо, что её частота не поменялась.
В моём примере выше плохо — что синусоида во-1, немного усохла и во-2, на фронтах у неё ещё и фаза съезжает (и частота тоже).
На каком основании фаза и амплитуда у вас считаются не важными? Они важны точно так же, как и сама частота звука.
Они поменялись => сигнал НЕ восстановлен.
Насчёт частоты в 20 КГц и названия «ультразвук» инсинуации вообще прошу прекратить.
Прямо сейчас сделал себе генератор на 21КГц. Совершенно точно могу заявить, что этот звук — СШЫШНО.
Если есть какие-то сомнения в моей честности или чистоте эксперимента, готов повторить эксперимент в присутствии любых людей.
Съезжание частоты и фазы — стандартное влияние частотных фильтров.
Это — немного другое мнение, не так ли?
Даже википедия с этим согласна, не говоря уже о результатах эксперимента.
Если действительно есть какие-то «многолетние исследования», которые говорят о том, что выше 20 КГц услышать никак невозможно, хотелось бы на них взглянуть. Не найдётся ли ссылки на исследования или описание простого эксперимента, который бы меня привёл к этим выводам?
Пока, простой эксперимент с Audacity говорит мне о том, что я эти звуки слышу.
Попробовал я файлы воспроизвести с ультразвуком — на моей звуковой карте это просто ужас, ультразвук вызывал появление слышимых колебаний в частотном диапазоне меньше 20кГц.
Вот прямо все ЦАП с частотой 44.1 звучат хуже, чем 192 кГц? В каких условиях сравнивали? Сколько ЦАП сравнили? Какие у них были цены?
По поводу ЦАПов, слышал я может чуть больше, чем среднестатистический пользователь. Однако, я видел и измерения меандра на 44.1/16. Мультибитный ЦАП с меандром с Т=100Гц справляется практически идеально. В то же время, ни один дельтасигма ЦАП не способен был воспроизвести фронт и спад без существенных искажений.
Мне этого достаточно.
Вот картинки ozvuke.pro/index.php?showtopic=434&view=findpost&p=1626
2. Музыку вы тоже слушаете осциллографом? :-) Спектр ровного меандра бесконечен. Возможности ушей ограничены сверху 20 кГц. Ваши уши в слепом тесте не отличат ровный меандр от «изуродованного».
должен тебя огорчить, когда ты без экспериментов возьмёшься за практику, съиграв чтото и отстроив красиво свой трек, пересемплировать его хоть куда-то обнаружится сложной задачей в экспериментах именно, когда матчасть, будет убеждать тебя "да забей! всё тут нормально" предлагая раз за разом тебе будто чужую одежду или укушенное яблоко вместо припасённого тобой к этой знаменательной дате... всё что ты говоришь - отлично подтверждается в видеотракте, но не в работе с аппаратурой композитора, всегда находящего как подчеркнуть прелести имеющегося оборудования, просто оставляя удачно звучащие варианты выбирая, и вдруг "математически и оптически(глаз видит одну октаву тремя резонаторами оценивая спектр света) неотличимый результат обработки" не содержит никаких музыкальных "алмазиков тобой отполированых" в режиме 24бит 192кгц, и писать в 16 44100 невозможно, тк включив 24 192 потом ты заметишь кучу нестыковок, в низком разрешении не слышавшихся... а их полировка время немало требует и выполняется с контролем сохранения "алмазиков" не всегда легко удаваясь
Сейчас подумал - посмотри на свои фотографии произвольно сделанные, и представь что тебе в паспортном столе предложили бы выбрать на паспорт лучшую фотку с одной камеры серию снимков делавшей, установленной рядом со второй, которая распечатывать паспорт будет выбранного номера снимка, но видишь ты одним фотоаппаратом, а получаешь "с незначительной погрешностью, туже резкость и цветность
это не заметишь на вокале или гитаре играя, это заметно на тембре волнового синтеза звуков, белый шум 44100 16 никогда не напоминает звук ветра получаемый в 192 24
Бесполезно проводить тесты на исходниках в виде классики или голоса, это всё достаточно медленно звучит - реальную разницу можно услышать только в спидкоре зарендеренном в высокой частоте, вы различите больше киков и снейров даже если у вас нет звуковой карты и фиговые динамики/наушники

Проверяем на практике бессмысленность высоких частот дискретизации