I want to believe, but… Виртуальная реальность или нереальная виртуальность звука Ossic X

    Предлагаем для обсуждения ещё один спорный проект, собравший не мало денег на кикстартере. Как и в предыдущей публикации о неоднозначной инновации в области аудиосистем, речь пойдёт о наушниках. Сбор средств разработчики «3D-чуда» от Ossic X начали ещё в позапрошлом году, а в этом месяце планируют запустить мелкосерийное производство. Скудные сведения о проекте и отсутствие данных о характеристиках очередных «супер ушей» не внушают доверия скептикам. Между тем, для реализации проекта, разработчики собрали $ 2 700 000 (при предположительной стартовой стоимости продукта на рынке $500, для оказавших поддержку $200).



    В этом материале мы постараемся понять, на что повелись люди, поддерживающие проект, и какие неоднозначные моменты наводят на серьёзные размышления о возможной фейковости заверений разработчиков. Признаюсь, что молниеносный сбор средств на реализацию проекта и положительные отзывы о прототипах, лично меня впечатляют. К сожалению, пока устройство доступно только по предзаказу, мы не можем его протестировать и сделать однозначный вывод. Но, вероятно, мы сделаем ещё одну публикацию, когда в нашем распоряжении появится это чудо современной техники. Подробнее — под катом.

    Анатомия и звук


    Подобно проекту Nura, который мы рассматривали в предыдущей публикации, разработчики Ossic X позиционируют свои наушники, как техническое воплощение революционной идеи, основанной на особенностях слуха. В отличии от упомянутых Nura, за основу берется не физиология (например, отоакустическая эмиссия), а анатомия человека. По словам разработчиков, Ossic X способен постоянно (real time) подстраиваться под анатомические особенности слушателя.

    «это первые в мире наушники, которые постоянно подстраиваются под вашу анатомию для наиболее точного и захватывающего 3D аудио.»


    Идея постоянной калибровки, с технической точки зрения, не вызывает предубеждения и легко проверяется на практике. При этом остаётся не понятным, каким именно способом производится калибровка и какие параметры она затрагивает. Психоакустические исследования, ещё при разработке первых стерео и квадро систем, достигли уровня, при котором можно воспроизводить звук с достаточно реалистичным расположением кажущихся источников звука, что вряд ли можно считать инновацией в полном смысле этого слова. Многие современные наушники избавлены от проблемы «звук внутри головы», без применения автоматически калибрующихся модулей.


    Ещё один момент, в материалах разработчиков фигурируют очень расплывчатые заявления о калибровке:

    «аудио алгоритмы с системой слежения за головой и индивидуальной анатомической подстройкой»

    Исходя из написанного, можно судить о том, что разработчики лукавят в отношении калибровки. Если изменения положения головы действительно требуют постоянной подстройки (например, при играх), то для учета анатомических особенностей уха постоянная калибровка нужна едва ли. Также остаётся не понятным, какая технология используется устройством для получения информации о форме уха и других анатомических особенностей, связанных с восприятием звуковых волн.

    Ossic X следят за головой


    По утверждениям команды Ossic X, наушники оборудованы встроенной системой отслеживания положения головы и торса (?), а также процессором, использующим алгоритм анатомической калибровки. Тут следует отметить, что в качестве научного базиса, для построения алгоритма, разработчики применяют HRTF (Head related transfer function) — функция передачи, зависимая от положения слушателя в пространстве, расположения источников звука и расстояния между ушами (по утверждениям разработчиков, ещё и от формы самих ушей, но подтверждения этому тезису мне найти не удалось).


    «Передаточная функция H(f) любой линейной инвариантной во времени системы на частоте f имеет вид:

    H(f) = Output(f) / Input(f)

    Метод определения HRTF также позволяет получить и импульсную характеристику (HRIR) h(t) для барабанной перепонки, представляющую собой реакцию на импульс Δ(t), воспроизводимый источником. HRTF H(f) представляет собой преобразование Фурье импульсной характеристики h(t).»

    Источник: audiophilesoft.ru/publ/theory/hrtf/6-1-0-342


    Важно понимать, что HRTF, является основой панорамирования во всех существующих системах записи и воспроизведения объёмного звука, в том числе и классического стерео. Эта характеристика не является чем-то принципиально новым ни в биофизике, ни в психоакустике, и практически всегда учитывается при разработке аудиоаппаратуры. Создатели наушников не приводят математического обоснования, лишь в скользь упоминают, что алгоритм построенна HRTF. Зачем упоминается о торсе – остаётся не понятным, равно как и принцип действия датчиков, которые отслеживают положение частей тела.

    Что определяет форму уха?


    Следующее утверждение вызывает еще более серьезные сомнения:

    «Это позволяет вашей уникальной форме уха взаимодействовать с 3D звуком так же, как это происходит со звуками в реальной жизни»


    Известно, что восприятия звуковых волн уникально и зависит от анатомии органа слуха. Остается не понятным, как именно система определяет форму ушной раковины, и на основании каких критериев производится калибровка, учитывающая этот параметр.

    Конструкция – 8 динамиков и всего 2 уха


    В оригинальной конструкции Ossic X использовано 8 динамиков, которые призваны обеспечить создание реалистичной звуковой картины.

    «Комплект динамиков обеспечивает точное расположение звука в пространстве.»


    Вероятно, разработчиков впечатлил опыт создания 7.1 систем, которые позволяют воспроизводить действительно объёмный звук. При этом следует отметить, что для создания реалистичной звуковой картины, подобной системе необходимо воспроизводить семиканальный звук. Рискну предположить (возможно ошибаюсь), что традиционная концепция 7.1 сложно применима для наушников, так как она теряет смысл из-за небольшого расстояния между излучателями и ухом.


    Каким ещё образом количество динамиков меняет звук в наушниках не уточняется. Я рискну предположить, что таким образом добиваются плотного звука. Это само по себе хорошо, но имеет лишь опосредованное отношение к объёму и формированию сцены. Остаётся неизвестным, реализован ли в наушниках кроссовер или же использованы широкополосные динамики.

    Подключение и интеграция


    В Ossic X реализованы следующие возможности интеграции и подключения: USB, AUX, 3.5 мм разъём. Обеспечена поддержка воспроизведения стерео, 5.1 и 7.1. Планируется поддержка VST и AU для звуков, созданных с использованием стандарта DAWs.

    Команда Ossic X активно привлекает создателей игровых платформ для разработки специальных плагинов под Unity, Unreal, Wwise, VST, AU, и пр. В данный момент разработан прототип FMOD плагина.

    Исследования


    Разработчики утверждают, что ими были проведены исследования, данные которых легли в основу продукта. С помощью микрофона, размещенного в ухе, они установили, воспроизводит ли наушник тот же сигнал, что и реальный звук в пространстве. Результаты сравнительного теста Ossic X и стандартных игровых наушников представлены на графике ниже.


    Кроме того, с участием фокус группы, разработчики пытались определить, откуда, по мнению испытуемых, идёт звук при воспроизведении. По заверениям разработчиков, их продукт, в отличие от других наушников, позволяет правильно определить направление расположения и удаленность звука.



    I want to believe…


    Для убежденных скептиков информации крайне мало. Более того, репутацию проекту испортила статья «Viel Lärm um nichts: 3D-Kopfhörer Ossic X ausprobiert» («Много шума из ничего: попробовал Ossic X), опубликованная немецким ресурсом heise.de, 06.01.2017, после выставки CES. В статье автор писал о том, что 3D звук в наушниках лучше не включать, а при традиционном не обработанном воспроизведении это вполне годные качественные наушники, которые стоят своих денег, но не являются чем-то революционным.

    Между тем, маленькому доверчивому аудиофилу внутри меня искренне хочется верить в то, что люди не потратили 2 700 000 $ впустую, и продукт обладает хотя бы частью заявленных характеристик. Надеюсь, что вы оставите своё мнение в комментариях.
    Pult.ru
    Крупнейшая сеть Hi-Fi, High End в России

    Комментарии 25

      +1
      Четыре маленьких динамика вместо одного большого это обычно плохие новости. А поддержку 3D звука, судя по статье, придётся внедрять в каждую игру отдельно, тоесть будет какое-то ограниченное количество совместимых игр. Если повезёт.
        0

        А почему-бы просто не сделать fallback-режим?

          +1
          Можно сделать fallback до стерео, или аппаратно/программно рассчитать звук, выданный неподдерживаемой игрой в каждом динамике даже с учётом поворотов головы. Но качество будет низким из-за потери данных при обработке готового звукового потока, выданного игрой, думающей, что это обычные наушники или например 4.0 система. Практически придётся заниматься интерполяцией, и слушателю максим будет казаться, что он слушает четырёхканальную систему в безэховой камере. Повернул голову — положение колонок сместилось. На уровне игры можно получить положения всех восьми динамиков в пространстве и правильно рассчитать расстояния/направления на каждый игровой источник звука. Вот если бы звуковые API по умолчанию поддерживали любое количество каналов с возможностью изменения их положения вокруг слушателя в реальном времени, не пришлось бы огород городить :)
            +1
            Раньше это умел Creative Eax, Aureal, OpenAl, DirectSound, но их всех убили, теперь появляются новые герои Atmos, DTS-X
        0
        К сожалению мне так и не довелось попробовать ни одни многоканальные наушники, потому сравнивать мне эти подходы проблематично, но все что я слышал из бинауральных записей, а так же демонстраций полностью синтетического «бинаурального» звука — восторга, лично у меня, не вызвало.
        Если мысленно заставлять себя «собирать» звуковую картину, расставляя источники, в том числе «за собой», то это еще худо-бедно работает, но только при условии что есть видеоряд, на который ты ориентируешься. за неимением видеоряда, все это начинает напоминать картинку с вальсирующей девушкой, которая крутить в разные стороны в зависимости от наблюдателя, словом звуковой образ — рассыпается и ты уже теряешь «нить», где же был звук…
        Тешу себя надеждами, что многоканальные наушники могут справиться с задачей лучше.
          0
          http://pesnix.ru/binaural-records/

          «Парикмахерская» послушайте. Только не настраивайте себя ни на какие ожидания. Начните с закрытыми глазами. Позже где-то на второй половине записи как минимум некоторые звуки ощущаются вне наушников, реально в комнате. Мужик в углу сидит. Можно даже перестать концентрироваться на прослушивании.

          Если не получится услышать ничего особенного, то могу лишь предположить, что данная запись была записана с конфигурацией, близкой именно моим ушам. Не знаю. Но это одна из немногих, которая удивила.

          Кроме того, впечатление несколько отличается на плохенькой (не знаю, почему) встройке и на Xonar DGX, на которой звучание более живое и ёмкое
            0
            Кроме того, впечатление несколько отличается на плохенькой (не знаю, почему) встройке и на Xonar DGX, на которой звучание более живое и ёмкое

            Встройку нужно же лыжной мазью обмазывать, чтоб электроны не застревали.
              0
              Это вы зря, любезнейший. У тру любителей лыжной мази, один аргумент — минус за публикацию или коммент, при наличии достаточной кармы. А тут-то всего навсего банальный человеческий субъективизм: ну живое оно у него, ну ёмкое, да прибудет с ним Cила и тёплый ламповый дисторшн)
                0
                Думаю дело в заваленных НЧ на встройке, на самых бюджетных реалтеках такое бывает, особенно если вендор материнской платы развел криво.
              0
              «Парикмахерская» была первой бинауральной записью с которой я познакомился. Увы, это была пожалуй самая слабая по эффекту запись, во всяком случае для меня.
              Тогда оно слушалось на beyerdynamic dt-770. Sony MDR 7506 — тот же эффект.
              Из того что более менее впечатлило: http://dearvr.com/
              Но в любом случае все эти эффекты «рассыпаются» стоит тебе перестать концентрировать внимание на мнимых источниках и видеоряде.
                0
                Так бинауральные записи только в «затычках» надо слушать. Там весь смысл в этом — доставить звук к барабанной перепонке, минуя ушную раковину.
              0
                0
                Не знал об этом. Спасибо за наводку!
              +1
              В мире, где успешно продаются аудиокабели за несколько тысяч долларов, эта технология обязательно найдёт себе покупателя. Если она и не выдаст каких-либо экспериментально или теоретически подтверждённых результатов, наберётся достаточно слушателей, которые себя в этом убедят, да ещё и других будут яростно убеждать. Благо, в прослушивании звука субъективные впечатления обычно куда сильнее, чем реальные ТТХ аппаратуры.
                0
                Если она не выдаст каких-либо экспериментально подтвержденных результатов, она взлетит гораздо более вероятно, чем если эти результаты появятся, ибо IMHO они покажут то, что мы все подозреваем.
                  +1
                  аберётся достаточно слушателей, которые себя в этом убедят,

                  Уже набралось, 2,7 млн мертвых президентов США собрали на разработку, без подтверждения результатов, а многие даже не послушав прототип внесли денег.
                  +2
                  >их продукт… позволяет правильно определить направление расположения и удаленность звука.

                  Вот это реально круто! Потому что например источник и направления реального звука я определить могу очень приблизительно в лучшем случае, а с наушниками — смогу! Выходит их звучание будет куда более реальным, чем реальное!!!

                  </sarcasm>
                    0

                    Скепсиса статья только добавила. 8 динамиков ухудшат АЧХ но объёма никак не добавят, должно быть 2-а динамика и эмуляция отраженного звука от ушной раковины, причем с отслеживанием положения головы и динамическим изменением источника воспроизведения.


                    Даже если это реализовать, то судьбу подобных тезнологий знает история, возьмем к примеру EAX от Creative из-за малой поддержки в играх технология так и не взлетела.

                      0
                      Ностальгирую по компании Aureal и ее технологиям A3D. У них получилось сделать технологию позиционирования звука на наушниках или 2/4 колонках. Был счастливым обладателем Diamond Monster MX300 (Aureal Vortex 2). В Half Life вполне получалось ориентироваться на звуки, с закрытыми глазами. К сожалению, после поглощения компанией Creative технология исчезла с рынка и не получила дальнейшего развития.
                        0
                        Были как-то usb наушники (польские вроде) за долларов 20. НЧ не было вообще, а высокие были очень сильно задраны. Излучатель пленочный 40 мм в диаметре. Так вот, в CS 1.6 меня два раза банили за якобы читы, хотя я просто мог определить по звуку шагов точное направление. А в NFS Most Wanted(старый который) было четкое ощущение, что я нахожусь сзади автомобиля. На других звуковых системах такого эффекта я больше не наблюдал.
                        К сожалению, протестировать их сейчас не могу, так как их «убило» молнией. Конечно полного присутствия они не давали, но эффект в NFS меня поразил.
                          +1
                          Качество тракта, судя по всему, не оказывает такого большого эффекта как кажется, как бы это не противоречило, например, тому факту что на локализацию источника звука в рамках стерео системы сильное влияние оказывает качество импульсного отклика системы в целом и минимизация разницы по его характеристикам в обоих каналах, что закономерно следует из специфики нашего бинаурального слуха.

                          Я до сих пор помню два случая в своей жизни.
                          1. Какой то новомодный в то время сайт на flash c анимациями, озвучкой всех кнопочек, менюшек и т.д. Фоном на одной из страниц звучал звук тикающих часов.
                          Я наверное на целый час засел на том сайте и исключительно ради этих самых часов. Без всяких аудиофильских фантазий, тонких материй и преувеличений. При том что акустика (какой то дешевый муз. центр AIWA!) стояли на расстоянии 1-1.2м друг от друга, я абсолютно отчетливо слышал звук тиканья ЗА пределами стереобазы, то есть за ее физическими пределами (за пределами самой акустической системы) с левой стороны. Теоретически — это невозможно, локализация мнимого источника всегда будет ограничена границами акустических систем. Но звук был далеко за пределами левой колонки. Тогда это привело в такой ступор, что я буквально встал из-за стола и пошел искать источник звука, так как первая мысль была в том что старый будильник, который валялся где то в комнате, внезапно начал тикать.
                          2. Опыт с одной из частью фильма матрица. Экранка со звуком из кинотеатра. https://www.youtube.com/watch?v=5J-aObhn_-8
                          На 3:07 в арранжировке появляется специфичный синтетический звук с ритмически изменяемой, пульсирующей фильтрацией.
                          В то время, если не ошибаюсь, у меня были Microlab Solo и какой то сабвуфер стоявший под столом сбоку от меня.
                          Весь звук был смазан, размазан, «убит», а чего же еще хотеть от звука из кинотеатра, и разумеется без нормальной стерео панорамы, но, вот этот «пульсирующий звук» локализовался абсолютно четко под столом. У него нет низкочастотной составляющей, во всяком случае достаточной для того, что бы попасть в должной пропорции даже в тот дешевый сабвуфер и таким образом изменить локализацию.
                          Абсолютно. Четко. Из под стола. Это совершенно невероятное ощущение. Это было ощущение что за этим звуком можно буквально нагнуться и достать его из под стола как упавший карандаш.
                          И да, я проверил тогда влияние сабвуфера на этот эффект и он его — не оказывал.

                          В общем учитывая стой опыт и все то что нам преподавали на факультете звукорежиссуры, лично я уверен, что есть некие механизмы, серьезно выходящие за границы теории бинаурального слуха, весьма и весьма тонкие и сложно уловимые.Именно эти два опыта в моей жизни доказали мне что «выход за стерео базу», ровно как и локализация источника ниже (полагаю что возможно и «выше») акустики — таки возможна, но объяснению не поддается.
                            0

                            Не знаю почему вас так удивила локализация звука за стерео безой… Вообще, одним из критериев проверки качества воспроизведения стерео (!) системы это послушать запись симфонического оркестра.
                            На хороших и правильно расставленных колонках я чётко локализую скрипичную группу, духовную, ударные… и понятно, что это все за пределами базы. Но это работает если только концентрироваться на музыке, сесть в кресло, лучше закрыть глаза. В качестве источника использовался обычный CD плеер, стерео усилитель и колонки (кажется какой то английской конторы)

                              0
                              Нет, оно не за ее пределами ) Все мнимые источники которые вы сможете локализовать, таки будут вписаны где то между левым и правым каналами, в том числе в крайних возможных положениях, но создать эффект «выхода» за эту границу — невозможно. Все что кажется «шире», это просто эффект восприятия звука, люди просто воспринимают звук именно «так» и не в состоянии очертить какую то четкую и резкую границу.
                              Можно объяснить это так: стерео база — это линия между акустическими осями левой и правой акустических систем, источник же, допустим, соло запись скрипки, это круг некоего диаметра, центр которого касателен к нашей линии и ограничен перемещением по оной. Панорамирование этой скрипки, это перемещение центра окружности, касательного к нашей вымышленной линии между акустическими системами.
                              Что будет если скрипку панорамировать полностью, допустим, влево? Да, геометрически наша окружность таки вышла за границы, но это не означает что стерео база стала шире чем то позволяется расстоянием, то есть длинной линии между акустическими системами.
                              В восприятии человека, да, никакой резкой как у тетрадного листа или экрана монитора границы, разумеется, нет, скрипка «вышла» за границы, но совершенно условно. Все это не означает что стерео база, то есть та свобода с которой мы можем переместить мнимый источник стала больше или что она больше чем у другой акустической системы и т.д.
                              Качество акустической системы влияет только на четкость локализации источника в рамках стерео базы, но никакая волшебная система не позволит сделать эту базу больше. Казаться больше, просто воспринимать на слух просто «вкуснее», краше, круче и просто приятнее — ради бога, но не шире чем есть.

                              Все прочие эффекты, где что-то, вроде как, таки вышло за границы — с большей долей вероятности окажется влиянием на всю звуковую картину ранних отражений и резонансов мебели и предметов интерьера, которые начинают «подпевать» акустике и кажется что скрипка была «вон там», в метре за границами стерео базы.
                              0
                              Тоже не раз замечал и сделал выводы, что основная проблема — заставить мозг воспринять звук как реалистичный. Тогда мозг «вписывает» его в реальность и только после этого можно говорить о позиционировании. А любой звук, который мне не кажется убедительно реалистичным (слишком громкий, слишком не естественное эхо/реверберация, иные искажения) позиционируется просто «примерно слева/справа»). Ну и полагаю, что должно учитываться именно мое расстояние между ушами и, быть может, хоть примерно их форма. Т.е. чуть другие задержки и уже не меня, а кого-то другого удивит.
                              0
                              Я и в жизни периодически путаю направление источника звука…

                              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                              Самое читаемое