Почти как человек, или новый подход к бинауральной звукозаписи / Comments / Habr

Позвольте, но ведь если дать человеку послушать натуральный, естественный звук он же не будет его воспринимать с какими-то перекосами. Кривые равной громкости Мэнсона-Флетчера, глубоким продолжением исследований которых, является стандарт ISO 226, описывают восприятие отдельных тонов, а не тембра в целом. Понимать его так вульгарно не стоит. Тем более, что эти кривые не совсем соответствуют влиянию ушных каналов и раковины на тембр.

Далее. Если мы запишем естественный звук на некий идеальный или близкий к идеальному микрофон и воспроизведём его с помощью идеальных колонок, то человеком этот звук будет восприниматься как естественный. То есть все искажения его слухового тракта будут накладываться на сигнал идентичный исходному, точно также как это происходит при восприятии естественного звука. Математически это можно представить как где это исходный сигнал, а добавляемые искажения слухового тракта. Вы же, по сути, предлагаете реализациюгде это искажения вашего стенда. И поскольку то вашу схему можно представить как , что довольно абсурдно.

Стоит при этом отметить, что основное назначение бинауральных стендов типа HATS состоит в измерении свойств наушников, особенно тех, что либо частично искажают воздействие ушной раковины, либо, находясь полностью в ушном канале, совсем отбрасывают её влияние. Для использования записи с таких стендов для прослушивания надо использовать специальные компенсирующие кривые, то есть совершать операцию вычитания приводя звук к должному состоянию.

Тоже самое, естественно, касается и различий в ушах — если оно уже присутствует у каждого конкретного человека то зачем пытаться его добавлять в стенд? Тем более, что эти различия, очевидно, индивидуальны. Более того, судя по всему мозг человека калибрует общую картину восприятия основываясь на информации ото всех органов чувств нивелируя и корректируя индивидуальные особенности типа разного зрения в глазах, различий в остроте слуха, наличия головного убора и т.п. Ваша идея добавлять искусственно эти аспекты вызывает некоторое недоумение. Если я что-то не так понял, или чего-то не учёл, прошу пояснить.

3DSound Jun 23 at 11:38

Спасибо за развёрнутый комментарий. Думаю, здесь возникло небольшое недопонимание самой задачи стенда.

Вы рассматриваете бинауральный стенд как измерительную систему, которая должна записать звук максимально нейтрально и ничего не добавлять от себя. В этом случае Ваши рассуждения про «двойное наложение» особенностей слуха действительно выглядели бы логично.

Однако «Маэстро» создавался не как измерительный микрофон, а как имитатор слухового восприятия. Его задача — не измерить звуковое давление в точке пространства, а сформировать сигнал так, как его воспринимает человек.

Человек никогда не слышит «чистый» звук. Любой звук проходит через голову, ушные раковины, слуховой проход и слуховую систему. Это не искажения в классическом смысле, а часть механизма восприятия. Аналогично тому, как зелёный цвет остаётся зелёным для всех людей, несмотря на различия зрения, звук остаётся узнаваемым и пространственно локализуемым несмотря на индивидуальные различия слуха.

Что касается ITD и ILD, то они не удваиваются при прослушивании бинауральной записи. Если запись уже содержит межушную задержку и разность уровней, то после воспроизведения через наушники эти признаки сохраняются. Уши слушателя не создают их повторно. Они лишь интерпретируют уже закодированную пространственную информацию.

Поэтому цель стенда не в том, чтобы добавить слушателю ещё одну пару ушей, а в том, чтобы записывающая система воспринимала звуковое поле приблизительно так, как его воспринимает средний человек, и сохраняла те пространственные признаки (ITD, ILD, спектральные особенности HRTF), на основании которых мозг определяет направление, расстояние и положение источника.

Отдельно отмечу, что ISO 226 я использую не как «эквалайзер тембра». Действительно, стандарт описывает кривые равной громкости для отдельных тонов. Однако любой тембр состоит из набора тональных составляющих. Поэтому частотная чувствительность слуха неизбежно влияет и на восприятие тембра в целом. В данном случае ISO 226 выступает не как цель, а как один из ориентиров при моделировании слухового восприятия.

Именно поэтому в проекте критерием корректности является не совпадение со средней анатомией как таковой, а способность системы формировать устойчивые и информативные пространственные признаки, которые большинство слушателей будет интерпретировать естественным образом.

Почти как человек, или новый подход к бинауральной звукозаписи

Comments 2

Articles