Как стать автором
Обновить

Комментарии 26

Только не вздумай это сказать аудиофилам.

Как бы любые такие дискуссии стоит начинать с описания тракта, на основе прослушивания которого делаются такие "термоядерные выводы", как в статье: " наушники не подходят для высококачественного воспроизведения фонограмм ". Лично у меня на такие утверждения всегда возникают вопросы: "какие именно наушники не подходят?", "для воспроизведения каких именно фонограмм?", " а что автор понимает под "высококачественным воспроизведением?" и т.д. и Но факт в том, что бинауральное восприятие можно получить и на МОНО акустической системе. И на записи, сделанной с ОДНОГО микрофона. И условием этого является именно реальное высокое разрешение и записи, и воспроизведения. А главным условием выстраивания "сцены" является достаточность для мозга поступающей для этого информации.

Нет. Мы обсуждаем не конкретную систему, а влияние некоторого технического параметра на ощущение пространственного слуха. Вот нелинейные искажения там на 25 месте. На 1 месте - бинауральный сигнал, . т. е разница сигналов между ушами, на втором искажения АЧХ

Разницу сигналов между ушами никто и не думает отрицать. И что на основе этого (в том числе) строится "сцена". Однако именно разрешающая способность (низкие искажения) позволяет мозгу более эффективно эту разницу интерпретировать и строить на этой основе "сцену". Кстати, если монофоничекая запись сделана хорошо, то в ней уже содержится информация о задержках и фазовых сдвигах из-за разного расположения инструментов в пространстве + отражения и реверберации в помещении. Поэтому при качественном воспроизведении (с высоким разрешением) через один канал тоже возникает пространственное восприятие музыки. Разумеется, оно отличается от стерео. В некоторых моментах в лучшую сторону, а в некоторых в худшую. Однако в любом случае присутствует. Книжки - это конечно хорошо, но там мягко говоря ответы не на все вопросы.

Это просто слова. Какие эксперименты вы проводили, по какой методике? С какими уровнями искажений? Какие пороговые значения заметности искажений получили? Сколько экспертов учавствовали?

shkal, если я вам расскажу, что после дня бывает ночь, а после ночи день (с промежуточными состояниями вечера и утра - вы тоже будете от меня требовать методики, экспертов, пороговые значения, и утверждать, что "это просто слова"? К чему вообще вот это доведение до абсурда?

За методиками и экспертами - это к тем, кто наукой занимается профессионально и за деньги. У меня же совершенно другие цели. Я сформулировал свои наблюдения, которые относятся по сути к ноу-хау, и поделился ими на безвозмездной основе. Если можете сходу опровергнуть - пожалуйста, опровергайте. Только тоже будьте добры - с четко поставленными научными экспериментами, по выверенной методике, репрезентативной выборкой экспертов и т.д. Сильно удивлюсь, если у вас что-то получится. Если хотите на этой основе сделать какое-то академическое исследование, с грантами, хорошими бюджетами на методики и экспертов - пожалуйста, возражать не буду. И с интересом ознакомлюсь с результатами. По сути это одна из целей таких публикаций - поделиться с теми, кто сможет в этом направлении пойти дальше и сделать лучше. Ну а тратить несколько месяцев на доказательные аспекты в академическом смысле - у меня нет таких ресурсов, в первую очередь потраченного времени жизни, тем более, что моя карьера лежит несколько в иной плоскости.

Да нет, это вы безо всякой доказательной базы опровергаете то, что люди до вас написали, которые таковыми исследованиями занимались

А что конкретно я опровергаю? Противоречий написанного с исследованиями нет. Читайте внимательнее.

А вот то, что пишете вы: " Пространственный звук в наушниках имеет примерно никакое отношение к уровню искажений " - вот это как раз полный бред.

Речь в обсуждаемой статье о наушниках и о том, что влияет на построение "сцены" именно в наушниках.

В статье по вашей ссылке, после слов про "дальнее ухо" и "ближнее ухо" - можно сразу же делать вывод о том, что к наушникам это имеет весьма отдаленное отношение. Как это на наушники вообще применить?

Читайте далее по упомянутым в статье "пойнтам":

1. Интенсивность левый правый (ну типа да, но это настолько грубо, что даже обсуждать нечего). Кстати, мной используется более корректное "согласование каналов", которое подразумевает, что речь о широкополосном сигнале, а не "интенсивность", которую можно применить лишь к заведомо одинаковым сигналам (либо узкая полоса, например синус; либо широкополосный сигнал, но полностью одинаковый по всей полосе, что в стереозаписи как бы совсем исключено в силу ее особенностей). Просто еще раз прочтите в статье про этот пункт: " Что касается именно согласования каналов, то это конечно параметр важный, при «построении сцены» он влияет на ее характер, расположение конкретных КИЗ в пространстве." Если это как-то противоречит хоть чему-то - поясните. Наушники, где левый и правый канал играют более или менее одинаково - это скорее правило, чем исключение. Однако в одних наушниках со "сценой" все плохо, а в других хорошо...

2. Частотная характеристика...причем как раз про спад ВЧ на расстоянии. Ну а у меня написано про искусственный подъем на ВЧ, который подчеркивает сцену... И какой из этого вывод? В чем тут вообще противоречие то?

Далее там про дифрационные явления между левым/правым каналом. В наушниках этого фактора при воспроизведении просто нет. Только как эффекты, попавшие в саму запись. Опять же запись играет одна и та же. Однако в одних наушниках со "сценой" все плохо, а в других хорошо...

3. Интенсивность отраженных звуковых волн. Ну так лучше всего отражаются как раз ВЧ. И опять же - повышая ВЧ в АЧХ получим подчеркивание "сцены". Ну наличие в моно записи этих отраженных волн как раз и является одной из причин, которая позволяет услышать некоторые "бинауральные эффекты" и в монозаписи с моно АС.

Вопрос же общего качества звучания и разрешения (искажений) в статье вообще никак не затрагивается. А зря. Он как раз позволяет услышать лучше вообще всё перечисленное.

Вот вообще не нашел в сей статье никаких противоречий с тем, что написано мной, и уж тем более одно вообще никак не опровергает другое (причем в обе стороны).

Вопрос: о чем вы вообще спорите и с чем конкретно не соглашаетесь? Ссылка на данную статью - как раз больше в подтверждение написанного мной.

Ну не любой разницей) Представим сильно искаженый источник звука, к примеру орущий голос в телефонной трубке, будут ли проблемы с локализацией этого КИЗ только из-за того что он искажен? Думаю мы без большого труда определим левее он или правее, выше или ниже, глубже или дальше. Оговорюсь, слушаем на стереосистеме в подготовленной комнате или в открытом пространстве. Насколько мне известно, сцена, прежде всего, формируется временной разницей (включая реверберацию) сигналов произвольного КИЗ для левого и правого уха и собственная нелинейность КИЗ никак не помешает связке ухо-мозг определить конкретную точку его в пространстве. А вот если искажения имеют фазочастотную природу, то тут картина действительно может поплыть, кривая фаза тракта, самих АС, плюс отражения от стен изрядно размоют картину.
И вот тут казалось бы решение! Наушники полностью убирают комнату, допустим они даже хороши по ФЧХ и сверхлинейны... Все так, да не совсем. С панорамной локализацией (лево-право) ухо-мозг более менее справляется, но координаты Y и Z куда-то подевались. Мозгу недостает временной и реверберационной информации из соседнего канала, которую он легко получал в комнате с АС. Пространство вроде бы есть, но оно неполноценно. Как видим, собственно гармонические искажения в деле локализации КИЗ дело десятое. Мозгу нужна информация другого рода.

Serge3, можно проверить эмпирически и то, и другое. Речь в статье не об особенностях бинаурального слуха, и не об особенностях акстических систем. Мои выводы - из опыта работы С НАУШНИКАМИ и распространяются только на них. Не смешивайте с опытом прослушки АС. А в наушниках - "сцена", отвязанная от пространства собственной головы, появляется либо при повышении разрешающей способности, либо при подчеркивании ВЧ-регистра. Это если без кросс-фейда. Как ни странно, на наушниках посредственных кросс-фейд "сцену" как бы немного добавляет, но с упрощением проработки фактуры отдельных КИЗ, нарушением размерности и т.д. На отличных наушниках и тракте - подключение любых плагинов и примочек с подмешиванием каналов - "сцену" ухудшает. Что касается записи голоса в трубке телефона, то если она сделана непосредственно с телефона - вы в наушниках не определите локализацию. Звук будет "в голове". Если все же воспроизведёте с АС, то звук будет либо привязан к колонке (если играет одна колонка), либо будет позиционироваться по центру (если 2 колонки играют в моно режиме). Если покрутить баланс влево-вправо - то можно будет определить в лучшем случае азимут. А вот расстояние и протяженность до КИЗ и его самого - вы в этом случае не услышите. А вот если записали уже по воздуху с хорошего микрофона (или с двух в стерео режиме), то локализация появится, потому что в записанном сигнале уже появятся все описанные нюансы временной/фазовой и прочей разницы, а также разные волновые явления от помещения.. Учитывая, что многие мелкие нюансы в "звуковой картине" воспринимаются на пороге слышимости и вообще разборчивости, обусловленной особенностями тракта, то повышение качества тракта (и в том числе наушников) сказывается на передаче всей этой информации весьма благотворно. И в принципе - какая бы ни была нужна для восприятия информация для интерпретации чего угодно в музыке - повышение реального разрешения/понижение искажений - сказывается на этом только положительно. Даже если сам исходник записи плохой и с искажениями - тоже. Меня, например, удивил в свое время опыт прослушивания оцифровок начала 20 века, где на хорошем тракте оказалось можно услышать и пространственные эффекты. Это с сквозь шумы/хрипы, моно и т.д. А вот на (скажем так) средних наушниках - эффекта нет. Также отмечу, что оцифровка этой же записи, но где "добрые люди" использовали шумодав - напрочь убивала всё, что касается пространства. Утверждение об отсутствии влияния искажений в тракте на передачу пространственных эффектов несостоятельно.

С данной книжечкой (и не только) - прекрасно знаком. К сожалению, они совершенно не объясняют факт наличия пространственных эффектов при прослушивании монофонических записей через монофонический тракт.

Объясняет, см главу о моноуральных и бинауральных критериях, по которым слух стройт положение источника

Кросс-фейдинг в виде подмешивания каналов друг в друга известен как минимум с момента появления стерео. И по факту звук в подавляющем большинстве портит. За исключением некоторых записей из 1960-х, где писали часть инструментов целиком в разные каналы.

Для получения сцены, кросс-фейдинг без учета фазо-временной характериистики не имеет смысла. На заре эпохи стерео инструменты писали в разные каналы потому что на большее не хватало ни фантазии, ни технических возможностей. Погуглите какие приключений хватанул Джордж Мартин, когда EMI решила что Битлы выходят в тираж и решила "на горячую" выпустить сборник ранних песен в стерео,

Тем не менее, именно ранних битлов, или какой-нибудь ранний джетро талл в наушниках в стерео слушать "как есть" очень неприятно. Нашел, попробовал послушать с кросс-фейдом. Тоже мерзко, вы правы. Лучше всего звучит в моно.

А как же популярное мнение большинства звукрежей, что при создании музыки муз сцену в наушниках нормально не отстроить. - Только посредством мониторов? Конечно, прослушивание сильно отличается от создания. Здесь всего лишь надо воспроизвести уже созданное, что можно сделать посредством той же имитации. PS: мне ближе именно создание, как многолетнее хобби.

Восприятие в наушниках и в АС - объективно разное. Это факт. Если пытаться отстраивать сцену в наушниках для воспроизведения потом через АС - результат будет закономерный. Да и даже при отстройке для АС - нормальные звукорежиссеры используют несколько разных комплектов мониторов, отслушивают и в ближнем, и в дальнем поле, да еще и "шит-контроль" в виде воспроизведения через типичный ширпотреб. Пытаются добиваться, чтобы приемлемо звучало на разных вариантах.

Мониторы среднего поля наиболее актуальны для контроля сцены, транзиетнам, чтобы сформироваться нужно расстояние, на полочниках они не успевают "собраться" должным образом. Зато ближнее поле хорошо себя показывает в более проблемных помещениях, сингал от них попадает в уши быстрее отраженки.
В наушниках детальность и линейность вообще приборно превосходят таковые параметры большинства АС. Но это все не про сцену. В АС кстати, АЧХ менее приоритетна в какой-то мере, чем временные параметры. Еще в наушниках отсутствует реверберация помещения, поэтому в них хорошо проверять баланс инструментов, выслушивать нюансы обработки. А вот сцена оценивается на больших АС. Каждый инструмент для своей задачи.)

Тоже всегда юзаю шит-контроль. И нередко после него приходится немного корректировать некоторые дорожки.

В статье написано про 2 фактора, которые при "реверс-инжиниринге" обнаружены в разных наушниках. Очевидно, нужны какие-то пояснения, ибо многим непонятно. 1. Разрешение (про него пояснил). Чем выше, тем лучше. Слышно больше нюансов, мозгу больше информации для построения "сцены" 2. Некоторые особенности АЧХ. Тут возможно стоит дополнительно пояснить. Дело в том, что тембральные особенности воспроизводимых трактом звуков определяются в том числе АЧХ. Например возьмем ноту ля (440 гц). В зависимости от тембра инструмента (в живом прослушивании), звук может и локализоваться, и нет. А зависит это от гармонического шлейфа, который присутствует в звуке инструмента. У той же Алдошиной где-то описано, что инструменты, в спектре гармоник мало, те, что есть, преимущественно четные, а гармоник высокого порядка (о 5-й и выше) в спектре очень мало - очень плохо локализуются в пространстве. Наоборот, инструменты, которые имеют в спектре выраженные нечетные гармоники высокого порядка - воспринимаются наиболее локализовано. Смотрим по гармоникам: 440 Гц - 1-я, 880 Гц - 2я, 1760 Гц - 3я, 3520 Гц - 4я, 7040 - 5я. Думаю, принцип понятен? Когда от основной ноты в тембрах подчеркиваются гармоники от 5 и выше - вот вам и подчеркивание локализации (хоть и за счет искажения тембров). Именно поэтому во многих "топовых" наушниках так любят подчеркивать этот верхний диапазон, кто от 7--8кГц, цепляя сибилянты, а кто и чуть аккуратнее - от 10 кГц и выше. Вот так это работает. Никакой аудиофильской эзотерики.

Наушники есть разные. Все они (кроме моно варианта) в разные уши играют разные каналы. Однако некоторые наушники категорически не умеют воспроизводить "сцену", а другие делают это достаточно хорошо. Вот про это и статья - за счет чего именно (кратко).

Что касается меня, как разработчика наушников Snorry - я придерживаюсь пути повышения разрешающей способности, чтобы не коверкать тембры. Они для меня очень важны. Как сохранение размерности и локализации образов. Поэтому подчеркивание ВЧ на АЧХ стараюсь не использовать.

Исхожу из того, что речь идет об стереозвуке. Упрощенно, в реальной комнате с АС слушатель левым ухом слышит не только звук левой колонки, но и часть звука правой, который проходит немного большее расстояние. Это дает эффект сцены. В наушниках каналы разделены, и звук из правого в левый не попадает, таким образом, сцены, при стандартном стерео в наушниках нет по определению. Есть звук внутри головы. Искажения не играют роли, никакой вообще. Согласование каналов.. в микрообъеме ушной раковины разность длительности импульса пренебрежимо мала. Сцена в наушниках возможна только при подмешивании перекрестно с определенными задержками сигналов правого/левого каналов. Как это сделать вопрос другой, процессор, специально подготовленная запись, методы есть разные.
Пример: Амазония Жан Мишель Жарра выпущена в двух версиях, обычном стерео и бинауральной (специально для наушников), там как раз есть все КИЗы в трехмерном пространстве.

Serge3

Еще раз - речь в статье О НАУШНИКАХ и "сцену" в них. Там ни слова про АС, студийные мониторы, ближнее, среднее и дальнее поле и т.д. Факт в том, что на наушниках с хорошим разрешением "сцена" есть, без каких-либо дополнительных мер. И кросс-фейд её ухудшает. Полагаю, как ни записывай - а определенные важные для восприятия вещи в запись все равно попадают, и мозгу этой информации хватает при определенных условиях (наличие хорошего тракта, наушников, слуха, в конце концов, и самого мозга, который имеет способность всё это интерпретировать). Если чего-то не хватает - результат будет другим.

Лет 20 назад, когда я в наушниковую тему еще не погрузился, тоже считал, что "сцена" в наушниках невозможна. Я вынужден был пересмотреть свои взгляды, когда случайно послушал знакомый фортепианный концерт в наушниках ТДС-15. Я отчетливо услышал, что один рояль на сцене стоит позади другого. Запись слушал на колонках раньше, но такого не замечал. Сказать, что меня это удивило и даже потрясло - это ничего не сказать... С этого собственно и началась эпопея сначала с модами наушников, а потом и разработкой с изобретениями, патентами и т.д.

Что касается приготовленных записей "специально для наушников"- для меня они звучат как минимум неестественно. Я там многие тембры просто не узнаю, а размерность образов тоже безобразно нарушена. Фактура отдельных инструментов, голосов тоже. Все такое карикатурно-гротескное. Судя по всему, что-то там делают не то...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории