Pull to refresh

Comments 54

Был у меня опыт взаимодействия с пульт.ру в Пермском отделении. Пришел с запросом - подобрать хороший 7ми канальный AV - ресивер для прослушивания музыки (ну вот такой у меня запрос, мне больше нравится объемность звучания музыки, чем слышать слабые покашливания на заднем ряду через стерео). В итоге поняв, что потратил 10 минут на пустой спор с продавцом, что я вообще ничего не понимаю в прослушивании музыки и вообще "мальчик тебе чего?", я ушел в уютный "семейный" салон, где оставил свои 150 тыс. и получил чего хотел.

Я считаю, что дискуссию про качество звука следует начинать следующим образом: взяли мы красивую мелодию 1 скрипки и записали в макс. CD качестве, выбрав, как и полагается качественной записи, ещё и весь доступный битрейт. Ок, берём это качество за условные 100% для сравнения. А теперь мы хотим добавить ещё 1 скрипку (и далее сразу транслируем выводы на то, что мы подключаем целый оркестр в итоге). Вопрос: каким-таким "Макаром", не изменяя ттх записи нам удастся не снизить её качество как в целом, так и отдельно той самой первой скрипки? Не для того ли нам нужны все эти 24/192, чтобы чисто технически упихнуть в даваемый ими битрейт максимум разных звуков, минимально теряя в их качестве, различимости и пр. "аудиофильских эпитетах" (на самом деле, пытающихся заменить некие отсутствующие необходимые нам технически измеряемые параметры для описания тех же вещей)?

Вы не с той стороны заходите. В CD битрейт не адаптивный и не проходит сжатие. Поэтому там и абсолютная тишина будет закодирована с тем же битрейтом.

Проще говоря, эти ~ 1400 кбит/с стоит воспринимать скорее как максимально возможный для данного формата. Как если там будут все звуки от 20 до 22000 Гц с динамическим диапазоном от 0 до -95 Дб.

Споры идут о другом. Может ли человеческое ухо слышать, что звук "раздроблен" 44100 раз в секунду и улавливать разницу между звуками, разница между которыми больше чем в 95 Дб. Ну и хватает ли ему 65536 ступеней громкости.

Ок, пусть споры о другом. Но, уже в этом ключе, разве понятие 44100 Гц квантования не заканчивается ещё перед диффузором играющего динамика, звуковую волну (аналоговую) от которого и слышит уже человек?

Не заканчивается. Волна же будет разной в зависимости от того, что было на входе.

Форма, размер и т.п. - нет, одинаковые. Квантизация же всего лишь интерполяционная характеристика волны. Волна "ломается" когда квантизация слишком низкая. А тут запас многократный. Я именно на этом основании и заявил, что "заканчивается".

Вы, кажется, не до конца понимаете физику процесса. Добавляя новые инструменты мы не увеличиваем битрейт, мы меняем форму звуковой волны внутри заданного битрейта. Как в оьщем то и в реальной жизни. Всё что воспринимают ваши уши-колебания среды, которых может быть больше или меньше, но это всегда статичный набор именно информации. Иными словами можно записать тишину с тем же битрейтом что и эта ваша скрипка, а можно и целый оркестр, количество информации в случае записи без сжатия не изменится, изменится только её неоднородность.

Я тогда не понял, каким образом число "скрипок" никак не влияет ни на битность, ни на частоту квантования и не меняя при этом и битрейт, ни вверх, ни вниз. На что-то же число инструментов должно влиять. Чудес-то в математике не бывает. А то сейчас это больше похоже на попытку объяснить мне про безразмерный автобус (муз. файл) и что в него влезет бесконечное число пассажиров (т.е. инструментов), заданного размера (24/96, например).

В случае записи без сжатия мы по сути записываем ряд фиксированных по длине чисел описывающих положение мембраны устройства в каждый следующий "тик" кодека. А поскольку у нас частота(количество тиков в секунду), и битность(в общем то количество бит задействованых на один "тик") не меняются-конечная информация тоже будет такой же.

Сильно упрощая: если у нас 2 бита то тишина(полная) выглядит как то так :"00 00 00 00 00", а какой то звук так:"01 11 00 01 10". Количество звуковой информации поменялось, количество информации записанной-нет. Именно потому что кодек без сжатия. Был бы со сжатием-заархивировал бы повторяющиеся куски.

Неважно, сколько скрипок, микрофон как был один, так один и остался. И чувствительность слуха как была 15 кГц, так и осталась. А вот если для каждой скрипки отдельный микрофон выделять — тогда да, получится многоканальная запись, но тогда и для воспроизведения потребуется столько же динамиков.

Всё, понял. 2+ инструмента теряют всю детализацию ещё проходя через 1 микрофон. Я думал, мастерят всё же через несколько...

Ладно, а в случае цифрового создания, где готовые семплы, каналы и нет "микрофонов", через которые пишется живой звук?

Суммарно всё равно же в одну стерео-дорожку складывается (или 5.1, неважно), и часть информации теряется. Можно слышать, что играет несколько скрипок, но звучание отдельно взятой вытащить уже не получится. Так же, как и нельзя узнать, было число 5 получено суммой 2 и 3, 1 и 4, 7 и -2 и т.д.

Дополню - "число скрипок" влияет на энтропию сигнала. Чем больше скрипок, тем больше энтропия, и тем ближе сигнал к белому шуму. Представьте себе 1000 играющих вразнобой скрипок. ;)

А дальше, если мы пытаемся этот сигнал сжать - энтропия влияет на битрейт, требующийся для сжатия, если одно фортепиано во flac ужимается без потерь до 200-300 кбит, то для фортепиано + скрипка потребуется уже 600-700 как минимум.

>тест — послушать в случайном порядке несколько записей с разной частотой дискретизации на хорошем цифровом аудиоплеере

Разница вполне может быть довольно заметная - чистая схемотехника, разные частоты по разному обрабатываются внутри, и это отличие зависит от конкретного DAC на котором слушают. Вот если все записии апсэмплить в максимально поддерживаемый формат и слушать так - тогда да, хотя тоже есть нюансы

Если не ради науки, а для себя, чтобы понять какие записи качать, то норм эксперимент.

Но можно ошибиться, иногда бывает разный мастеринг для CD и для цифрового релиза 24/96. А иногда лучший мастеринг оказывается в GuitarHero)

Для начала надо определиться с динамическим диапазоном... усилителя. А его динамический диапазон и уровни шумов в принципе не могут дотянуть до 100дБ. Тут возникают ограничения на уровне физики.
Мало того, ни один даже самый лучший выпускаемый 24 бит дельта-сигма АЦП не может оцифровать сигнал с точностью выше 18 (максимум -20) разрядов на частоте дискретизации. Вот если взять и измерять значение в течение нескольких секунд, то точность будет повышена в корень от соотношения частот.
Основной цимес тут все-таки в принципиальном отличии типов оцифровки - 16 битные АЦП - дешевые (но быстрые) АЦП последовательного приближения, которые могут ловить помехи выше одной второй частоты дискретизации, отражая их в нижние частоты и внося искажения, которые невозможно чисто математически выделить. Для предотвращения этого необходимы аналоговые фильтры, которые вносят свои искажения, особенно сильно на высоких частотах. Получается прокрустово ложе.

Дельта-сигма АЦП такого недостатка лишены. Но лишь в последнее время был достигнут прогресс в части повышения частоты дискретизации. Изначально дельта-сигма АЦП были очень медленные, их основная сфера применения была сверхточное измерение медленно меняющихся процессов. Также большая проблема на таких разрешениях - сверхмалошумящий источник опорного напряжения, потому что все шумы и дрейфы от него уходят в оцифрованный сигнал. А уменьшить уровень шума кремниевой аналоговой электроники в 200 раз (приблизительно 8 бит) задача технически почти невозможная. Однако такой АЦП не требует использования входных фильтров, соответственно, он может на всем диапазоне частот одинаково точно оцифровывать сигнал.

Понимаю, что это перевод, но все же.

благодаря более высокой плавности и слитности звучания в среднечастотном диапазоне, Hi-Res записи однозначно достойны внимания слушателей

Что конкретно имеется в виду под плавностью и слитностью звучания?

Частота дискретизации влияет исключительно на доступный частотный диапазон. Причем это влияние без градаций: просто есть предел, выше которого звуки передать не выйдет. Расширение этого диапазона никак не улучшит запись частот, которые в него и так входили. Звук с частотой 880 Гц, записанный с частотой дискретизации 44,1 кГц будет звучать абсолютно аналогично тому-же звуку, записанному с частотой дискретизации 192 кГц.

Разрядность квантования влияет на динамический диапазон и привносит шумы. Что в теории может и могло бы улавливаться на слух, но насколько мне известно, качественно поставленных экспериментов, это подтверждающих, особо нет. Имеется в виду для 16+ бит, разумеется.

Ну и отдельно камень в огород переводчиков. Вот эта картинка, которую вы, судя по всему, добавили для наглядности (в исходной статье ее нет) - не имеет ничего общего с реальностью. Нет в 16-битном звуке никакой лесенки. На выходе будет такая-же плавная синусоида. Хоть с 16 битами, хоть с 4. Хоть с 192 кГц дискретизацией, хоть с 16 кГц. Просто у 4 бит форма этой синусоиды будет сильнее отличаться от оригинала, чем у 24 бит.

В целом единственное реально полезное применение у форматов с повышенной разрядностью квантования и повышенной частотой дискретизации - это при записи и мастеринге. Там многие манипуляции с дорожками могут расширять и динамический диапазон звука, и частотный. Поэтому банально удобно иметь запас. А вот для прослушивания зачастую даже полезно иметь исходник, в котором обрезано все что выше 22 кГц. Потому что этот высокочастотный писк, будучи скормленным устройству, которое не умеет адекватно его воспроизводить, может порождать артефакты на более низких частотах.

Хотел тоже поругать статью за неграмотную картинку, но вы уже это сделали за меня) Всем сомневающимся - советую очень наглядную демонстрацию в видео (https://wiki.xiph.org/Videos/Digital_Show_and_Tell, есть текстовая расшифровка)

По поводу Hi-Res музыки есть старая, но все еще актуальная статья - https://web.archive.org/web/20180307183656/https://people.xiph.org/~xiphmont/demo/neil-young.html (ссылка на web-archive - на оригинальном сайте ее уже нет) и ее обсуждение на hackernews (https://news.ycombinator.com/item?id=15127633)

8 плюсов, мне грустно… «На выходе будет такая-же плавная синусоида. Хоть с 16 битами, хоть с 4.»… «Просто у 4 бит форма этой синусоиды будет сильнее отличаться от оригинала, чем у 24 бит.» Логика просто фантастическая… Это не просто «хромая лошадь», это вообще лошадь без ног. И таки да, если взять в руки паяльник, х резисторов, собрать 4-х битный цап, подать злополучные 880 Гц, то на осциллографе мы увидим… лесенку, мать её так! Вот зачем вы придрались к картинке, которая значительно ближе к реальности, чем этот ваш «Звук с частотой 880 Гц»? Согласен с вами, что высокая разрядность удобна в цифровой обработке сигнала, но если вы застали времена, когда звук издавался пищалкой PC (1 bit), то вы согласитесь, что разрядность цапа тоже имеет значение. p.s. (флуд про фильтры на выходе предлагаю пропустить)

флуд про фильтры на выходе предлагаю пропустить

С вашего позволения, предложение я отклоню. Фильтры на выходе - такая-же часть ЦАП, как и все остальное (х резисторов в вашем случае).

Во-первых, ЦАП в целом и его разрядность в частности - вещи немного ортогональнальные формату хранения (в статье именно об этом - о форматах хранения). И этих сохраненных данных достаточно для восстановления плавного сигнала без лесенок. Хоть с 4 битами, хоть с 24.

Во-вторых, даже реальные аудио ЦАП не выдают никакой лесенки. Да, они могут привносить (и привносят) искажения. Но сигнал на выходе при этом все равно плавный и без лесенок. Хоть с 4 битами, хоть с 24 битами. То что вы можете собрать плохой ЦАП без low-pass фильтра - это конечно круто. Но не очень понятно, что это должно доказать. Реальные ЦАП этот фильтр имеют и лесенок не выдают.

но если вы застали времена, когда звук издавался пищалкой PC (1 bit), то вы согласитесь, что разрядность цапа тоже имеет значение

Во-первых повторюсь, что речь про ЦАП вообще не шла. Ни в статье, ни в моем комментарии. Во-вторых, даже про разрядность квантизации никто не писал, что она не имеет значения. Имеет. Просто для 16+ бит и человеческих ушей это значение пренебрежимо мало. И любая сколь угодно низкая разрядность (даже 1 бит) не означает автоматически наличие лесенок. Лишь обилие шумов и низкий динамический диапазон. Лесенки будут только с плохим ЦАП без ФНЧ.

Вот зачем вы придрались к картинке, которая значительно ближе к реальности, чем этот ваш «Звук с частотой 880 Гц»

Затем, что к реальности картинка отношения все же не имеет. Потому что лесенка на ней подается как готовый выходной сигнал, который мы слышим. На деле же это в лучшем случае промежуточное представление сигнала внутри некоторых видов DAC. Но даже у них на выходе никаких лесенок нет (если конечно у DAC стоит цель восстановить исходный сигнал, а не какая-то другая).

Как по мне, всё, что выше CD-Audio равносильно разрешению FullHD и 4K на 5-дюймовом дисплее смартфона. Да, оно гарантированно лучше передаёт детали, но человеческие органы чувств не способны уловить данных улучшений. Более того, даже совсем престарелый формат сжатия с потерями MP3 при использовании современных кодеров показывает довольно высокие результаты на битрейте 128 кбит/с, вплоть до того, что люди не могут найти отличий и путаются в том, где сжатие с потерями, а где оригинал. https://www.youtube.com/watch?v=ZvzqYuimxlE

равносильно разрешению FullHD и 4K на 5-дюймовом дисплее смартфона

Вы удивитесь, но в случае эксплуатации Google Cardboard-подобных очков со смартфоном, предпочтительнее будет все же 4K разрешение на последнем.

но человеческие органы чувств не способны уловить данных улучшений

Способны, только оборудование нужно не с динамическими излучателями, а с электростатическими: там даже отдельные инструменты становятся легкоразличимыми на слух, не звучащими из общей "бочки". Любое же lossy-кодирование смешивает их обратно.

Кстати, после перехода на электростаты разучился понимать различия между lossless 44/16 и более высокими разрешениями - на обычных наушниках казалось, что 24-битные поярче звучали, но не более того, тут же - отличий вообще никаких.

Чудеса.

Не подскажите модель наушников и усилителя к ним? Как они вам "зашли"?

KOSS ESP/950, сейчас в продаже они идут, как Massdrop x Koss ESP/95X

Зашли настолько, что прекратил уважать винил, и все, что с ним связано.

Где-то с месяц ловил вау-эффекты с множества треков, пока не привык.

Но, на самом деле, кмк, зайдут любые другие модели электростатов - там другая технология, из-за чего и звук другой.

Повышенная частота семплирования позволяет более точно получить исходный сигнал. 44,1 кГц выбрана не случайно - тут работает теорема Котельникова-Шеннона-Найквиста, которая гласит, что "что для сигнала, представленного последовательностью дискретных отсчетов, точное восстановление возможно, только если частота дискретизации более чем в 2 раза выше максимальной частоты". Но если представить себе синусоиду сигнала 22 кГц и расставить на ней отсчёты на 44,1 кГц, то станет видно, что у нас есть грубо говоря один отсчёт с небольшим на полупериод, но тем не менее мы можем получить 22 кГц. Увеличение частоты дискретизации до 192 кГц даст возможность получить верхнюю границу на 96 кГц (что ушам не нужно), но, кроме того добавит в несколько раз больше значений и меньшим частотам, (что ушам очень хорошо). Практически же я собрал себе простенький бюджетный комплект из HiFi Berry (формально поддерживает 192kHz/24bit), усилителя Denon upa f88 и колонок Kenwood ls 880a и гонял cd и оцифровки пластинок. Разница в качестве от повышенной дискретизации гомеопатическая, впрочем некоторые оцифровки звучат офигенно, но я это связываю с тем, как оно оцифровывалось, а не с повышенной частотой. Ну и комплект у меня специфический - не любая музыка играет на нём хорошо.

Спасибо, что написали про теорему К-Ш-Н, а то уж я думал, мне придётся. Лень же. Все, кто работал с цифровыми сигналами, в частности, с преобразованием Фурье, - их ночью разбуди, спроси про частоту Найквиста, так все ответят: вдвое больше граничной частоты спектра. Но вот с такой трактовкой

кроме того добавит в несколько раз больше значений и меньшим частотам, (что ушам очень хорошо)

я бы не очень согласился. То есть, что точек на период синусоиды будет больше - это факт. Но что уши это услышат - не факт. Собачьи уши - да, у них граничная частота выше. Но если мы признаём, что у человеческих ушей граничная частота 20 кГц, то что вы им не подсуньте (хоть треугольники) - они сами сделают синус, поскольку выше гармоник они (уши) не слышат. Поэтому нашим ушам что 5 точек на период 20-ти кГц, что 10 точек - принципиально без разницы. То есть (имхо), цифруя выше 48 кГц, вы просто перегружаете усилитель паразитным ультразвуком. Я полностью согласен с автором коммента выше (Dim0v) - следовало бы просто резать спектр входного сигнала выше 22 кГц. Всем было бы спокойней.

Я тоже никогда этого не понимал. Мол, да, человек не слышит частоту больше 22 кГц (на самом деле и выше 18 мало кто слышит), но якобы он при этом чувствует гармоники таких частот в более низком тоне. Звучит как мистика какая то. Не подтверждается ни здравым смыслом ни слепым тестированием.

А то, что все повадились лослесс формат слушать это понятно. Бесплатный способ почувствовать себя аудиофилом.

Хотел тут добавить нравоучений о том, что вместо погони за битрейтом лучше бы люди повышали музыкальный вкус... Но нафиг. Никого не хочу обижать.

но, кроме того добавит в несколько раз больше значений и меньшим частотам, (что ушам очень хорошо)

Мягко говоря, неожиданный вывод непосредственно после упоминания теоремы Найквиста.

Да, значений будет больше. Но все эти добавленные значения абсолютно побоку и ушам, и ЦАП, и динамикам. Синусоида 22 кГц, семплированная и с 44,1 кГц и со 192 кГц, и со 100500 гГц может быть восстановлена в своем первозданном виде. Да, даже если есть всего лишь "отсчёт с небольшим на полупериод".

В качестве чуть более простой аналогии можете представить, что восстанавливаете не график суммы синусов, а график простого полинома. Аналогия практически идеальная, если степень полинома воспринимать как аналог частоты.

Если вам нужно семплировать прямую, то для этого будет достаточно двух точек. И из них можно будет восстановить всю прямую. Вот прямо от минус бесконечности до плюс бесконечности. Вы можете взять на этой прямой 3 точки, 5 точек, или 10. Но прямая, восстановленная по 10 точкам будет точно такая-же, как и прямая, восстановленная по 2 точкам. Да, график параболы по 2 точкам уже не восстановишь, потребуется 3. А для полинома 9 степени - все 10. Но если наши "уши" "слышат" только полиномы 2 степени, а все более высокие степени "отфильтровывают", то брать больше 3 семплов нет никакого смысла. Достаточно перед взятием семплов так же отфильтровать входной график, выкинув из него члены со степенями 3 и выше.

То же самое и с синусами. Если во входном сигнале обрезать частоты выше 22 кГц (а оставлять их нет смысла, ибо ухо не услышит), то частоты семплирования в 44,1 кГц будет достаточно, чтобы из полученных семплов восстановить исходный сигнал один-в-один.

Как вы понимаете - трактовка теоремы рассматривает идеальный случай, когда сигнал начался бесконечно давно и никогда не закончится. В реальной жизни исходный аналоговый аудиосигнал конечен во времени и один этот факт делает его восстановление невозможным, как бы мы не старались, я только это хотел сказать.

Уже на первой секунде воспроизведения погрешность восстановления опускается намного ниже шумов квантования.

Там очень красивая математика есть, которая описывает суть процесса. По своей сути ИКМ сигнал, кроме оригинального сигнала несёт в себе множество амплитудно-модулированных копий исходного сигнала. Самая первая составляющая имеет несущую частоту равную частоте дискретизации. Боковые составляющие уходят, как и при обычной АМ в низ и вверх по спектру. Отсюда и необходимость брать частоту минимум в раза выше максимальной частоты спектра полезного сигнала, т.к. в этом случае эти самые дополнительные составляющие смешаются с полезным сигналом и исходный сигнал невозможно будет выделить. При таком раскладе, чтобы обеспечить качество сигнала необходимо:

  1. Перед дискретизацией обеспечить отсутствие в исходном сигнале частот, в двое превышающих частоту дискретизации.

  2. После декодирования сигнала обеспечить срез частот, которые заведомо выше максимальной частоты полезного сигнала.

При выполнении этих двух условий исходный и декодированный сигнал будут практически идентичны.

UFO just landed and posted this here

>Вообще-то все не совсем так, точнее совсем не так.

здесь вы прямо в точку попали, по всем делам связанным с усилителями, есть к примеру книжки douglas self, заметим что ухо тоже кодирует аудио сигнал для передачи в мозг, причем с существенными индивидуальными отличиями, которые типа калибруются уже серым веществом

Поддержу, и очень интересно было бы развить эту тему - "Чем мы слушаем?".

Как я понимаю, ухо - не АЦП, который передает в мозг форму кривой давления воздуха на чувствительном элементе. Все эти 100500 чувствительных элементов, которые входят в резонанс с достигающим их звуком - передают в мозг скорее спектрограмму сигнала, с ограниченным разрешением по частоте и динамическим диапазоном.

А значит - биты и килогерцы точности пропадают втуне, сначала теряясь на мембране динамика, потом в воздухе, а потом - на чувствительных элементах уха. Плюс еще и сами элементы уха зависимы друг от друга, при сильном возбуждении одних гасятся другие - что и позволило создать фраунгоферовцам психоакустическую модель и изобрести mpeg, который, выкидывая 90% сырых данных - создает нечто, слышимое практически как изначальный звук.

Поэтому присоединюсь к сомневающимся в целесообразности 24бит/196кГц. Да, в любом случае большая точность не хуже, но вопрос в том, услышим ли мы это?

PS: Идея для аудиофильской продукции - очиститель воздуха, который удаляет из него всю пыль, тем самым исключая интерференцию высоких частот на пылинках, и повышает "воздушность" звука.

вы понимаете правильно, человек воспринимает информацию в том числе звуковую интегрировано, типа своей обученной нейронной сетью, сегодня предположим ок, а через год с новым опытом и на новом материале не обязательно, поэтому такой раскардак с терминологией - тут тебе и теплое ламповое звучание, и глубокое, и 3х-мерная сцена, и пр., imho единственное о чем интересно говорить - звучание естественно или нет, причем всего тракта и на хорошо вам известном материале, типа знаете как конкретный голос или инструмент звучит реально и сравниваете,

>присоединюсь к сомневающимся в целесообразности 24бит/196кГц.

на мой взгляд все сложнее, сами по себе биты это далеко не все, но поскольку физически четких критериев таки нет, кто его знает, что там в сером веществе происходит, к примеру читаю review на сайте amir`а (что-то 24бит/196кГц) вижу результаты тестирования, цифры говорят - есть ли косяки или нет, не более, но на его личное субъективное мнение всегда внимание обращаю, таки человек много чего слышал, его нейронная сеть неплохо настроена вероятно, это тоже значение имеет, как обычно imho

из какой древности высосана эта статья? - я 16-битных АЦП уже четверть века не встречал - даже у встроенной в материнку или смартфон звуковухе АЦП 24-битный

Четверть века назад на материнке в лучшем случае было что-то типа Creative Vibra 16. Потом было AC97, которое умело в 48.0/16 и только потом пришло HDA, которое уже научилось в 24 бита (про кол-во значащих бит среди всех этих вариантов я лучше промолчу). Правда всё это обычно сопровождалось отвратительной разводкой (и схемотехникой) цепей аналогового питания и земли, что позволяло слушать перемещения мыши и работу жесткого диска, сначала в 2.0, а со временем и в полноценном 7.1 звуке.

во первых четверть века тому запись звука для CD делали не на встроенных в материнку звуковухах, а на профессиональной аппаратуре. Впрочем на маковских материнках четверть тому стояли АЦП Burr-Brown вполне себе пригодные для проф. записи. Это потом фруктовая компания скатилась на банальные Реалтеки, а затем вообще на унылые энергосберегающие Циррусы с неотключаемыми "улучшайзерами". Ну и во вторых, упомянутые тобой звуки мыши указывают на то, что при оцифровке звука первоочередное значение имеет аналоговая часть, а вовсе не битность АЦП

Пардоньте, изначально про «даже у встроенной в материнку» разговор, если чесать про запись в студиях, то это уже совершенно другое дело. А про аналоговую часть я всю дорогу и имею всем что сравнивать по «у меня тут 192/24, а твоя внешка такого не умеет» это клинический дибилизм, т.к. если засрать звук в самом начале, то далее его исправление превращается в весёленькое занятие (и попросту невозможно в нормальном виде).

На мой вкус, 16bit 44.1 LavryBlack DA10 звучал лучше чем SACD Maranz (на HD650)

Для того, чтобы проверить на практике преимущества Hi-Res, все желающие могут провести любопытный тест — послушать в случайном порядке несколько записей с разной частотой дискретизации на хорошем цифровом аудиоплеере.
Только для начала надо удостоверится, что у всех этих записей идентичный мастеринг — поскольку даже с обычным 44100 каждый новый релиз нестареющей классики студии ремастерят максимально агрессивно, чтобы разницу в звучании было хорошо слышно. И единственный путь для этого — получить Low-Res из Hi-Res качественным даун-семплингом, чтобы избежать наложения частот и искажения АЧХ/ФЧХ (внезапно, далеко не все топовые аудио-редакторы имеют качественную реализацию ресемплинга). Вот только после этого можно сравнивать, и вангую — на качественной аппаратуре вслепую никто не услышит разницы. А вот на некачественной — вполне может, если частоты выше 20кГц (уровень которых в hi-res довольно низкий) будут вносить катастрофические искажения в слышимый диапазон спектра.

Можно пойти и другим путём — отфильтровать нижнюю часть спектра, оставив только высокие частоты, и для начала просто определить, включен плеер или нет. В случае, если вы их таки слышите (что на моей практике ни разу не встречалось) — можно задрать их уровень повыше и сделать для себя вывод самостоятельно — действительно ли вы хотите это слушать или там только грязь и шум. Для плеера foobar есть и подходящий плагин для этого (сорри что на гугл-диске, никак не могу соорудить сайт для своих поделок).

И единственный путь для этого — получить Low-Res из Hi-Res качественным даун-семплингом, чтобы избежать наложения частот и искажения АЧХ/ФЧХ... Вот только после этого можно сравнивать, и вангую — на качественной аппаратуре вслепую никто не услышит разницы.

В точку, на мой взгляд. Я делал такие эксперименты, и не раз. Если звук хорош - я разницы не слышу. Старый, наверно, совсем стал.

А почему все забывают про фазу? На высоких частотах с фазой уже почти не проиграешь. А именно она и даёт эффект пространственного звучания. На 44100 на "тарелочках" уже с пространственным звуком не поиграть. 22кгц фаза звука может вообще принимать только 2 состояния. А нам надо его двигать вокруг. Так же верхние гармоники дают большие сдвиги фаз через интермодуляции. По итогу в моно выше крыши и CD, при объёмном звучании от хайрес толк есть. В играх это чуствуется.

Никуда эта фаза не девается и не искажается — это раз, никто не способен определить фазу отдельно взятой частоты — это два, при сведении музыку стерео-панораму формируют амплитудой, а не фазой — это три, помещение фазовую картину искажает намного сильнее — это четыре, психоакустика в этом играет не последнюю роль — это пять.

У CD слабенькое разрешение по нынешним меркам. И вот почему:

Да, теоретически позволяет частоты до 22к. Но для этой частоты остается всего 2 отсчета на полупериод. Синус 2мя отсчетами не воспроизвести. Возьмем 16кГц их слышат очень многие (я слышу громко и четко). На них приходится 2,7 отсчета! В результате, на частотах близких к теоретическому максимуму, имеем грязь, кучу гармоник. Каждый может взять осциллограф и посмотреть что там творится...

Это же касается хорошего динамического диапазона когда в записи есть большая разница между громкими и тихими звуками. Тут не хватает 16 бит. На еле слышно пиликающую скрипочку приходится слишком мало бит.

В итоге, для CD имеем агрессивный мастеринг. Звукорежиссер вынужден сжимать динамический диапазон чтобы хватило бит и придавливать верха по частоте чтобы там небыло грязи. Музыка становится ззжатой. На попсе этого не заметно а вот на сложных записях вроде рока или симфонии...

На хай рез можно не зажимать музыку такой мастеринг сразу радикально выигрывает на хорошей апаратуре.

Синус 2мя отсчетами не воспроизвести
Прекрасно воспроизводится. Вы вообще в курсе, как апсемплинг в кратные частоты делается? Промежутки между отсчётами заполняются нулями, а затем фильтруются. Даже чисто механически эту фильтрацию можно производить — слышали о разрушенном резонансом мосте от проходящих по нему солдат строем?

Вкурсе про фильтрацию и все прочее. Недостаток разрешения это не компенсирует.

Если ЦАП не в состоянии обеспечить адекватное преобразование — это проблема ЦАПа, а не разрешения источника данных. Есть конечно ситуации, когда 44.1/16 действительно может быть недостаточно — но это в случае оцифровки, чтобы был запас по ДД и частоте для последующей обработки.

Не только для последующей обработки. Это позволяет сделать полноценную запись в принципе, без "урезания" под формат CD или мп3. Советую послушать и все сразу станет ясно. Запись, изначально сделанную для хай-рез, а не сделанную для ширпотреба и в высоком разрешении. Во втором случае это будет все равно что смотреть DVD апскиленный до ФХД например.

Проблема CD не в урезании, а в постобработке рипа и его шумоподавлении. Любительские винил-рипы звучат живее не потому, что это винил, а потому, что звук никто не портит «вычищением от грязи» — в то время как студии позволить себе не могут, потому как маркетинг. Особенно в начале эры CD, когда нужно было всеми неправдами показать, какой там чистый и кристальный звук. Мне как-то попадался рип Пинк Флойда с мастер-ленты — так так шум было невооружённым ухом слышно! Куда делся этот шум в издании на CD? Туда же, куда и нюансы звучания и полноценный ДД — отфильтровались и замаскировались.

Характерный признак записи, сделанной для ХД - громкость сразу надо прибавить в 2-3 раза. При этом уровень пиков - в норме! Просто сжатие динамического диапазона много меньше, чем в ширпотребных записях.

К сожалению, ХД записей делают очень мало. Разный мастеринг делать дорого не все могут себе позволить. да и незачем.

Ну а слушать в ХД обычный ширпотребный мастеринг нет смысла разницы будет очень мало или вобще никакой т.к все урезано...

… благодаря более высокой плавности и слитности звучания в среднечастотном диапазоне, Hi-Res записи однозначно достойны внимания слушателей,

ИМХО, тут основная причина лучшего звучания хайрез в том, что качественный постфильтр реализовать проще. Никакого оверсемплинга с интерполяцией, реализация ФНЧ — простая.
Т.е. сделать хорошо звучащий ЦАП — проще.

Я, честно говоря, вообще, не понимаю: в чем проблема в актовом зале или аудиостудии разместить 10-100 микрофонов с АЦП 32бит 1MSPS (Мегасэмпл-в-секунду) на каждый канал и потом даунскейлить в кодеком с достойной психоакустической моделью и приемлемое качество для клиента.

Нелинейность микрофона к частотам компенсировать в оффлайне (привет, DSP!).

Нужно вводить новые кодеки, которые будут иметь лучше модели и более приятный для уха звук, а не меряться килогерцами и килобитами или ламповостью усилительного тракта.

Sign up to leave a comment.

Articles