Комментарии 92
Затем, что, как написано в посте, стереозапись сведена для воспроизведения на колонках, а не в наушниках. Чтобы в уши приходила нужная сумма звуковых волн, на наущники и на колонки нужно подавать разный сигнал.
Не равно ибо дело не только в переотражениях, они лишь для реалистичности картины. А по факту в безэховой камере мы один монитор слышим двумя ушами, между которыми есть некое расстояние и голова :-) то есть в зависимости от угла будет задержка и частотная коррекция.
Для звукорежиссёра разница между мониторами и наушниками огромна. В наушниках можно выполнить какую-то часть работы, но с панарамированием и обьёмом, работают исключительно через мониторы, причём разные.
работают исключительно через мониторы, причём разные.
можно расшифровать часть фразы про «причём разные»?
работают исключительно через мониторы, причём разные.можно расшифровать часть фразы про «причём разные»?
Скажите, те умнейших чела, что поставили моему вопросу 2 минуса:
В вашей вселенной все являются экспертами по звуку? Вы представить не можете, что кто-то не понимает столь простейших по вашему мнению вещей?
Вы можете простым языком объяснить несведущему человеку, что такое «работают через разные мониторы».
В каком смысле они разные?
Мониторы бывают ближнего, среднего и дальнего поля.
Означает ли, что звукорежиссеры проверяют все на 3 версиях?
Мониторы дальнего поля — полнодиапазонные… Для обычных помещений… Обычно выглядят как колонки с парой 12-15" динамиков в каждом кабинете. Пригодны для домашнего применения в качестве нормальных АС..
Ну вот смотрите. Сижу я за компьютером в небольшом кабинете.
Хочу иметь не ущербный звук, могу себе позволить хорошее оборудование.
Вы меня убедили, что дального поля мониторы — то что нужно по звуку.
Однако меня смущает слово «дальнего».
Как это будет выглядеть в небольшом кабинете (там место буквально на 2 компьютерных стола плюс небольшой проход, но я там один)?
Есть ли смысл брать технику «дальнего поля» в столь небольшое помещение?
ИМХО дилетанта следует ещё учитывать рабочий уровень громкости АС
В студиях контрольные мониторы тоже ставят в достаточно больших помещениях.
Получить внятный звук на десятках-сотнях Гц сложно и, чёрт побери, дорого.
Во-первых, нужны большие динамики, т. к. для обеспечения звукового давления, аналогичного средним частотам нужно большое объёмное смещение (то есть площадь диффузора * на его ход). Кроме того, см. кривые равной громкости: чтобы звук на 40Гц было слышно с аналогичной громкостью, как 1кГц, звуковое давление должно быть значительно выше. Это дорого,
Идём дальше. Для исключения стоячих волн в помещении нужно либо поглощение, либо определённые виды коррекции АЧХ.
Поглощение на десятках Гц проблематично без существенного уменьшения объёма комнаты, т. к. поглотитель нужно размещать в «зонах максимальной скорости», а это 1/4 длины волны от стен, почти метр для 100Гц!
Активная коррекция сравнительно легко делается для единственной точки в пространстве (правда с оговорками).
Если нужна более широкая зона, то есть вариант «DBA»: en.wikipedia.org/wiki/Double_bass_array
Но для этого нужно несколько сабвуферов, что тоже не дёшево и влезет не в любую комнату, особенно если в квартире живёт кто-то ещё.
работу АС можно считать работой в свободном поле, что в точности равно подаче сигнала в наушниках..а это мягко говоря не так, и отражений даже в контрольной комнате предостаточно, по этому я и привожу в пример безэховую, где всёравно подача не эквивалентна, по чисто физиологическим причинам.
Вы слишком категоричны в своих суждениях, видимо в силу молодости.
Мониторы разные могут быть даже в пределах одного поля из-за особенностей восприятия в диаппазоне\ах раздела, в них имеется необходимость и по этой же причине всю работу нельзя сделать исключительно в дальнем поле.
Да и сами эти поля сегодня существуют не от не совершенства акустических систем, но для некоторых практических потребностей сведения.
Если посмотреть на те импульсы от IRCAM, то там кое-что видно, правда не факт, что это отражения от стен. Возможно работает оборудование, используемое в рамках исследования — собственно монитор, сервопривод, стул и т. п.
По словам людей, работавших в камерах (в т. ч. ещё более серьёзных), стоячие волны на НЧ заметны на измерениях абсолютно в любой безэховой камере, следовательно отражения есть.
Не стал писать об этом в основном тексте, но судя по всему, для ещё большего «эффекта присутствия» имеет смысл добавить как раз немного отражений. В Dolby Headphones они есть. Там на выбор несколько вариантов обработки, самый «прямой» из них называется как-то типа «studio», и там отражения тоже есть (по анализу импульсной характеристики), хотя ухом практически не слышны.
"отличий в этом случает нет и нет даже предпосылок для отличий"
Ты хочешь нас убедить, что звук из левой колонки не попадает в правое ухо, а из правой колонки — в левое?
Законы акустики с тобой не согласны.
А вот в наушниках подобного смешения каналов нет. Потому там звук и отличается.
Никогда не приходилось встречать записи, в которых вокал, например, есть только в одном канале? Автор про это пишет.
Обычно это такой художественный приём, его не нужно «исправлять».
Если совсем это сложно слушать в наушниках, то либо просто в моно слушать, либо и правда, только на колонках.
Кроме того, у автора есть несколько наивнейших допущений.
Например, что звукорежиссёры и всякие продюссеры, которые говорят, как звукорежам работать, не знают, сколько телефонов продаётся в мире и сколько людей слушают музыку в наушниках.
«Да и вообще, эквализация под свои вкусы никогда не помешает.»
А вот это в рамочку :)
Его не нужно исправлять, когда оно играет из колонок. Потому что звук все равно дойдет до обоих ушей. А когда ты в наушниках, начинает казаться, что ты оглох на одно ухо или что наушники сломались. Так себе ощущения, я вам скажу.
Если совсем это сложно слушать в наушниках, то либо просто в моно слушать, либо и правда, только на колонках.
Либо в наушниках, но с коррекцией, как у автора. Почему вы такой вариант не рассматриваете в принципе?
«Лучшего пространственного разрешения в наушниках я пока не слышал.»
(«лучшего, чем до того, ведь я правильно понимаю?»)
Скажите, а вы рассматриваете вариант, что сотни и тысячи инженеров и музыкантов за очень неплохие деньги уже работали над подобными проблемами?
И существует даже небольшое количество «бинауральных записей», созданных именно ради объёмного звучания в наушниках.
Но насколько я знаю, там как правило именно *запись* производилась с помощью искуственной головы с микрофончиками в ушных раковинах.
Пагадити. Про импульс я понял (ну так, но вроде достаточно для старта, если что). А что делать с реальным музыкальным файлом? Тоже через gnu octave его гонять? Или у вас в гитхабе волшебный инструмент, а я мякотку и упустил?
… я буду дочитывать до конца. Понял, зачем нужен stereo convolver, спасибо.
Воткнуть в плеер плагин от Dolby (через VST bridge, как я понимаю). Тут автор показывает, как такой плагин в принципе пишется.
Тестировал их Sound Card Pro, там можно выбирать виртуализацию больших систем (а ля 20 колонок, и не только в горизонтальном поле) — и у них это реально работает, прям слышно.
Звук у них на голову лучше HeSuVi — а это ближайшее доступное что есть.
Но самая большая проблема (на ноябрь 19 года) — то что после перезагрузки их программа ломается, звук начинает производить с треском. Очень надеюсь, что починили, давно не проверял.
Но, как понимаю, все сводится к FIR с разными коэффициентами для левого и правого канала?
Каков размер импульса? Вряд ли больше 30мс, тогда и FFT с его погрешностями, задержками и стыковкой кадров — не нужен, все, по идее, делается в лоб, через линейную свертку.
В плане «приготовления» фильтра — тоже верно, FFT «не нужен». Собственно в конечном итоге я и вычислял фильтр более «прямым» методом (МНК).
При realtime'овой обработке тоже можно считать свёртку «в лоб», но есть нюансы.
1. Более ресурсоёмко, даже при сравнительно небольшой длине фильтра.
2. Не всегда даёт более высокую точность по сравнению с хорошо реализованной FFT-свёрткой.
3. Банально существует гораздо меньше готовых инструментов. Stereo Convolver можно взять и скачать, а аналогичный по функциональности плагин, выполняющий свёртку во временной области придётся писать (как минимум — обёртку над готовыми движками). Ничего архисложного, но учитывая п.2, на это жаль времени.
На ПК с SSE должно быть еще шустрее. Даже МК делают mac операцию за 1 такт.
С FFT разве нет сложностей с краями кадра и не пришлось делать перехлесты и прочий «кроссфэйдинг»?
Казалось, что плагинов, которые умеют в свертку действительно много. На столько, что они просто есть даже в бюджетных аудиоредакторах, как незначительный пункт меню. Поэтому их и трудно найти — под рукой.
Плагинов для свёртки — да, много, но 90% из них — как раз используют FFT, а другие 99% — не умеют накладывать один фильтр на «прямой» сигнал, а другой — на «перекрёстный», то есть непригодны «из коробки» для поставленной задачи (crossfeed с HRTF).
Можно организовать систему плагинов, примерно так:
— скопировать стереопару, то есть получить два идентичных стереосигнала — A(t) и A'(t),
— поменять в A'(t) каналы местами,
— исходную пару A(t) обработать одним фильтром (либо не обрабатывать вообще),
— клонированную пару A'(t) — обработать другим фильтром,
— снова сложить эти два стереосигнала.
Но подобное в realtime можно сделать тоже далеко не в любом плеере. С гирляндами vst-плагинов, прикрученными к плееру (уже не помню, с какими именно я это пробовал) у меня был в своё время негативный опыт, хотя возможно, в 2021 году с этим лучше.
Просто сейчас я не вижу в этом необходимости — мне проще взять Stereo Convolver и просто использовать.
Явной разницы между фильтрацией «в лоб» и через Stereo Convolver я не услышал. Но да, на досуге будет интересно сравнить более вдумчиво на слух и на глаз (в аудиоредактори или в том же GNU Octave).
Другое дело, что плагин построения АЧХ проверяемого плагина довольно непросто найти, есть только 32 бит.
Как вариант — взять тот же Stereo Convolver (по ссылке в посте выложен код на сях) и вместо FFT вкрутить обычную свёртку. Это и за один вечер не проблема сделать, даже если немного повозиться с оптимизацией.
А ради построения АЧХ что-то писать — вообще не вижу смысла (если не на коммерческой основе). Достаточно пропустить через испытуемый плагин единичный импульс и посмотреть FFT в любом аудио-редакторе.
C FFT, насколько я знаю, именно так и делают — перехлёст с наложением подходящей оконной функции.Нет ни перехлёста (применительно к исходному сигналу), ни наложения оконной функции. Подробнее здесь.
Видимо когда писал сообщение выше, смутно вспоминались какие-то другие методы. Возможно, WOLA, упоминавшийся в этой статье на Вики :)
Есть как минимум два подхода для реализации быстрой свертки. В предложеном вами нет перехлеста исходного сигнала, но нужно обрабатывать перехлесты промежуточных сверток.
Альтернативный подход - overlap save предполагает перехлест исходных данных, но не требует дополнительной обработки.
Ошибки порядка 0.05 (и это не фиксированная аддитивная или мультипликативная ошибка). Стоит поискать более подходящий плагин.
Тем не менее, в том же GNU Octave свёртка с помощью FFT реализована хорошо, и на реальном музыкальном сигнале даёт ошибку порядка 10^-17..10^-16 по сравнению со свёрткой «в лоб». Это значительно ниже шумов квантования, но считается примерно на порядок быстрее.
Вывод — как я и написал ранее, *правильная* реализация свёртки на FFT не хуже реализации свёртки в лоб.
Добавил об этом абзац в исходный пост.
В ADAU*, возможно не используется FFT из-за ограничения по ОЗУ. При реализации в ПЛИС, насколько я знаю, по этой же причине часто используют «прямую» свёртку.
Памяти в ADAU — несколько видов, в старших чипах есть FFT и FFT акселераторы.
FFT и аналоги используются для полифонии, ради которой можно потерпеть разумные задержки.
А каким методом посчитали ошибку в Stereo Convolver в сравнении с Octave?
Ошибку в Octave посчитал очень просто.
Вычислил свёртку одного и того же музыкального фрагмента (44кГц, 16бит — кажется, под руку попалось что-то из Led Zeppelin) с одним и тем же импульсом (полученным как описано в посте), вычел один результат из другого и посмотрел минимум, максимум, RMS. Максимум получился на несколько порядков ниже шума квантования, так что детальнее разбираться не стал.
Для Stereo Convolver попробовал также — увидел в разностном сигнале нечто, явно коррелированное с сигналом на уровне порядка единиц процентов (от максимума сигнала до вычитания). Стал играться с выравниванием уровня, то есть добавлением постоянного множителя — без явных улучшений.
Было подозрение, что Stereo Convolver делал что-то с постоянной составляющей сигнала — тоже попробовал скорректировать без особого успеха.
Попробовал слушать полученный разностный сигнал — там явно что-то менее очевидное, чем эти две вещи. Дальше пока не исследовал. Склоняюсь к тому, что надо просто сесть и переписать.
думаю, если потребуется, можно и на FFT получить в пределах 1мс «лишней» (то есть сверх того, что даёт сам импульс) задержки, выиграв в несколько раз по вычислительной сложностиМожно, для этого используются гибридные алгоритмы, используя свойство дистрибутивности. Для этого импульс делится на несколько частей, самая первая считается через прямую свёртку, чтобы не было задержки, остальные — через БПФ, результаты складываюся.
"В наушниках часто возникает ощущение, что источник звука находится где-то внутри головы."
Это признак очень плохо тракта. Буквально уровень наушников "купить за $5 в переходе метро" и например встроенный звук в материнскую плату пк, который сделан максимально экономно, лишь бы был.
Уже с более-менее среднего уровня сцена становится читаемой, а на приличной аппаратуре и наушниках можно легко понять, где какой инструмент играет, как он расположен в пространстве.
Из записей когда гитары в один канал и вокал в другой я помню только ранние Битлз, тогда я так понимаю стерео ещё не успели толком использовать. Пинк Флоид 70-тых уже звучит отлично. Можно ещё привести записи эпохи войны громкости, но так они везде будут звучать как говно. Там сцены вообще нет.
Что у вас за наушники и какой источник?
Намного интереснее, если кто-то не согласен с мнением — написать, с чем именно не согласен, почему и как.
Также всё это прверялось с доп. усилителем (композит с AD815 на выходе) и AKG k-501.
Есть очень годный плагин для foobar2000:
Bauer stereophonic-to-binaural DSP (http://bs2b.sourceforge.net).
ИМХО на голову выше, чем Dolby Headphones.
Действительно, ушная раковина немного изменяет звук, приходящий с разных направлений и так мозг понимает откуда пришел звук. В некоторых записях я слышал интересные эффекты, построенные на этом принципе. Это когда играет стерео в колонках, но кажется что звук идет сзади. При этом сзади никаких колонок нет!
Но с реализацией этого всего есть куча проблем.
У всех уши разные и мозг «приучен» к своим ушам. Так что универсальности не будет.
А сйчас этим вобще никто заморачиваться не будет т.к музыкальная индустрия деградирует и качественный звук мало кому нужен.
Действительно, ушная раковина немного изменяет звук, приходящий с разных направлений и так мозг понимает откуда пришел звук. В некоторых записях я слышал интересные эффекты, построенные на этом принципе. Это когда играет стерео в колонках, но кажется что звук идет сзади. При этом сзади никаких колонок нет!
Гуглить «barber shop 3d sound»
Великолепный пример объемного звука, умещенного в обычные стереонаушники. Слушать в наушника.
Причем это файл был создан еще в древние времена, когда техника была куда как менее совершенной.
Было квадро и много эксперементов интересных.
Сейчас это вобще никому не интересно. Все сидят в соцсетях и слушают с стрим телепончиков.
Просто преобразовать звук с помощью фильтров для своих ушей не получится. Т.к это надо сводить запись сразу с применением этих фильтров для разных источников звука с разных направлений. Этим точно никто заниматься не будет.
Так что тема интересна для своих эксперементов не более.
Но это дорого, и мало кому нужно.
"Это когда играет стерео в колонках, но кажется что звук идет сзади."
Это называется бинауральное стерео.
Некоторое время назад искал плагины для плееров, чтобы звук 5.1 / 7.1 в бинауральное стерео конвертировать для просмотра фильмов. Но ничего нормально работающего не нашел.
Creative Super X-FI позволяет воссоздать характеристики высококачественной профессиональной мульти-акустической системы и обеспечивает невероятную симфонию звука в ваших наушниках, используя сложные алгоритмы и объемные вычисления для индивидуальной настройки звучания с помощью составления карты головы и ушей.
Поставил в очередь.
У данной технологии есть несколько недостатков по сравнению с небезызвестным Smyth Realizer:
- Работает только на ПК
- Максимум 7.1, то есть никакого atmos в ней не услышать
- Невозможно отслеживание положения головы, так как используется поканальная запись для фиксированного положения колонок
В общем всем советую, микрофоны стоят копейки, звуковую карту можно у кого-нибудь одолжить, разве что пред собрать может быть проблема, но можно купить\одолжить готовое решение для конденсаторных микрофонов.
PS: Прошу прощения, проморгал когда пост извлекли из песочницы, а тут уже столько обсуждений! :)
С бинауральными микрофонами мысль хорошая, оказывается, уже есть вполне доступные для хобби варианты.
Условно измерения можно разбить на 3 этапа:
- Запись тестового сигнала от каждой колонки для каждого уха внутриушными микрофонами
- Запись тестового сигнала через наушники внутриушными микрофонами
- Запись тестового сигнала от каждой колонки откалиброванным измерительным микрофоном в точке прослушивания
Если применить свертку (в терминологии не уверен, потому что математическую часть не знаю) сигналов из п.1 и п.2, то получим отклик, который внутри себя содержит информацию об всем воспроизводящем тракте, включая саму колонку, о комнате, ну и об ухе пользователя. Соответственно при прослушивании будет полная иллюзия того, что мы слушаем конкретные колонки в конкретной комнате. При этом АЧХ самих внутриушных микрофонов значения не имеет, так как её влияние «самоуничтожается» за счет того, что оба измерения мы производили ими.
Но, если в вычисления добавить запись из п.3, то можно избавиться от влияния комнаты и оборудования воспроизведения, и оставить только отклик уха слушателя. То есть при прослушивании аудиоматериала через наушники будет имитироваться именно «безэховая» камера и «идеальный» громкоговоритель. Вот к такому сигналу уже можно применить импульсы записанных «правильных» помещений и наслаждаться прослушиванием.
Конечно прямо идеального результата такими домашними измерениями добиться не получится, всё равно набежит какая-то погрешность на каждом измерении, но отзывы от тех, кто этим заморачивался очень положительные.
Полностью компенсировать отклик комнаты — практически невозможно, там есть как математические ограничения, так и физические.
Например, не любое преобразование вообще можно инвертировать.
Другой пример: в точке прослушивания может быть очень сильный провал на АЧХ за счёт влияния помещения, и если пытаться его полностью компенсировать, начнуться проблемы с переполнением разрядной сетки, увеличением погрешностней, размахом результирующего сигнала и т. п.
Собственно, всё это и определяет сложность систем типа DRC.
Преимущество вертуализации в том, что можно один раз заморочиться при замерах: убрать из комнаты всё лишнее, умеренно заглушить, найти удачную точку для записи и удачное расположение для колонки (нужна только одна, остальные записываются методом поворота слушателя вокруг своей оси), и в итоге получить хорошие отклики, которыми можно с комфортом пользоваться всю оставшуюся жизнь в наушниках.
Кроме того корректировки в «виртуальной» комнате делаются проще, чем в реальной. Например для того, чтобы скомпенсировать провал АЧХ в реальном помещении при прослушивании на колонках, нужно поднять соответствующие частоты в источнике, что может привести к указанным вами негативным последствиям, я же описывал пример, когда мы убираем этот провал не с помощью предварительного усиления определенных частот, а с помощью вырезания этого провала из замера колонки бинауральным микрофоном. То есть в итоговом отклике этого провала не должно быть в принципе.
Просто АФАИК, проблема как раз в том, что если есть отражения, то полностью их инвертировать не получится, а в комнате они есть всегда.
То есть полностью заменить измерения в безэховой камере математической обработкой — нельзя. Насколько можно приблизится, и в каких случаях этого достаточно — вопрос дискуссионный.
Что можно попробовать — это снять отклик в большом зале, чтобы до прихода первых отражений от стен и потолка у нас уже было достаточно информации. Вот только с полом так просто не получится…
Этот метод часто используют разработчики акустических систем (особенно DIY) для оценки АЧХ. Но если это коммерческая разработка, то хотя бы в конце обычно снимают АЧХ «правильно», то есть в безэховой камере за деньги.
Но вижу и один неучтенный эффект при измерении внутриушными микрофонами. Дело в том, что мы слышим не только колебания давления воздуха, но и приходящие через кости и плоть на косточку, стремя, улитку механические колебания. А вот как это измерить представить себе не могу. Поэтому видимо разница между мониторами и наушниками будет оставаться всегда. Вся надежда на то, что это слабый эффект. Вы много прочли по теме. Не встречали оценку его величины?
Ну и конечно остается вопрос о самом аудиоматериале. На мой взгляд, мы просто вынуждены формулировать задачу как «услышать то, что было задумано звукорежем» т. к. ничего большего нам не светит и проверить что добились цели невозможно. Настоящий аудиоматериал появится только когда технология с объективным контролем доставки заданного звукового давления до каждого уха с коррекцией индивидуальных особенностей станет доступной. Это была бы очередная революция в аудио и наверное самая удивительная после патефона. Вот тогда и появятся настоящие произведения искусства, заточенные сначала под реализм, а потом и под всякие извращения, как это уже можно было наблюдать в живописи. Хорошая тема! Спасибо, автор!
На самом деле, обычно его измеряют не прямым способом (подачей короткого импульса на колонку и записью результата с микрофона), а как раз с помощью свип-тона (почти то же, что ГКЧ). Просто от записанного свип-тона переходят к импульсной характеристике, т. к. с ней удобно работать, и она полностью описывает АФЧХ, отражения и пр. Кроме того, по сравнению с прямым измерением импульсного отклика, значительно улучшается соотношение сигнал/шум.
2. Про косточки.
ИМХО, то, что происходит с сигналом начиная со слухового канала в данном случае не имеет значения, т. к. там эффекты будут одинаковы при прослушивании через колонки и наушники.
Другое дело, что самые правильные с этой точки зрения — внутриканальные наушники-«затычки». А с большими наушниками всё становится менее строго…
3. Про революцию
Слабо в это верю, т. к. нет спроса. В качестве иллюстрации: ТТХ аппаратуры (особенно массовой) за последние 20 лет значительно улучшились, а качество фонограмм — нет…
Касаемо классики. Как я понимаю часть работы дирижёра как раз заключается в регулировании громкости отдельных инструментов в оркестре. Интересно что будет, если поставить стереомикрофон рядом с ним, чтобы послушать, так сказать, оригинал. Или он всё-же «крутит уровни» отдельных музыкантов с учётом того, как музыка будет звучать в зале?
А что Вы подразумеваете под «мониторными динамиками» и под «лопухами»?
Размер НЧ-головки? В контрольных мониторах она вполне может быть 15", тем не менее, это вроде как «мониторный динамик».
Мониторы большого размера — стоят дороже и требуют бОльшего помещения для нормальной работы. И в целом они лучше, т. к. позволяют получить достоверный звук на более низких частотах. Полагаю, по этой причине «для ролика» чаще выбирают более качественные, то есть более крупные и более дорогие мониторы.
Ролики — ролики на ютубе, когда звукорежиссёр работает в наушниках. Колонки не видел. Вот и хотел увидеть описываемую вами работу звукорежиссёра, просто интересно.
fft_div = fft(impulse_opposite) ./ fft(impulse_direct);
impulse_tf = real(ifft(fft_div));
По-умному это называется deconvolution
Нет, этот код не является деконволюцией. Используя умножение в частотном домене, полученным через FFT — вы делаете не свёртку, а циклическую свёртку. Небольшим ухищрением из неё можно получить линейную свёртку — а вот обратить уже нет, даже если в исходной свёртке нет умножения частот на 0, и даже не только из-за возрастания шумов на низких амплитудах. А потому что из обращения свёртки с импульсом с затухающей со временем амплитудой мы чаще получим импульс, у которого амплитуда импульса возрастает со временем (как коэффициенты в расходящихся рядах). В этом вся проблема, и на текущей момент у неё нет однозначного решения. Именно поэтому вам пришлось использовать МНК и умножение на оконную функцию — вы получили лишь один из вариантов приближённого решения.
Ну и спектров рассматриваемых импульсов статье очень сильно не хватает.

Здесь хорошо видно, что:
1) они довольно шумные, особенно в области высоких частот,
2) имеют довольно сильный перепад по амплитуде — 30 дБ! Более вероятно, что именно в этом причина значительного изменение тонального баланса в наушниках, а не их кривая АЧХ by design.
Поскольку исходная АЧХ неизвестна, то имеет значение не абсолютное значение амплитуд (и фаз, которых на этом графике нет), а их разница между левым и правым каналом. Поэтому лично мне кажется правильным использовать их не в сыром виде (или с деконволюцией) — а сгенерировать разностный и сглаженный в частотном домене импульс и использовать его только в одном канале.
Насчёт применения импулься только в одном канале — я собственно так и предлагаю. А насчёт того, что этот импульс наужно генерить разностным способом — довольно спорно. Мне кажется, деконволюция здесь более уместна.
Sennheizer
sennheiser :) В немецком s читается как з, z как ц, зенхайзер
Делаем звук в наушниках объёмным. Цифровая обработка сигналов для домашнего применения