Кодек Full-HD Voice для мобильных сетей



    На Всемирном мобильном конгрессе в Барселоне специалисты Fraunhofer IIS провели демонстрацию первого в мире телефонного звонка в сетях LTE с использованием аудикодека AAC-ELD (Enhanced Low Delay AAC), который обеспечивает качество Full-HD Voice.

    Сейчас в большинстве сетей сотовой связи используется кодирование звука в полосе 3,5 кГц, в то время как человеческий слух способен воспринимать диапазон 20 кГц. Кодеки класса HD Voice передают в полосе 7 кГц, а Full-HD Voice кодируют и передают абсолютно весь слышимый диапазон, так что качество звука теперь ограничено только возможностями микрофона и динамиков/наушников.

    В настоящее время Full-HD Voice уже используется в нескольких системах видеоконференцсвязи, но впервые такой кодек интегрирован в мобильные телефоны (на платформе Android) и проведён реальный сеанс связи между ними.
    Поддержать автора
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 21

      +2
      Осталось ждать начала появления сервисов заказа музыки через звонок :)
        0
        Интересно можно ли будет в существующие смарты этот кодек запилить?
          –1
          Начнём с того, что кодек наверняка запатентован, а смарт придётся порутить. Как минимум, теряется гарантия; а не как минимум — можно нарваться на судебный процесс по делу о нарушении патентного законодательства.
            0
            Юридическая сторона вопроса мало интересует. Вопрос в том можно ли его будет использовать на существующем железе и в существующих сотовых сетях с технической точки зрения.
              +1
              Есть достать исходники или либу, то поверх интернет соединения (wi-fi/3g/4g) если собеседник поддерживает можно запилить соединение. Тут скорее ещё есть поддержка на уровне оператора связи со всеми вытекающими.
              Только не думаю что всё будет так открыто и тем более распространено на устройствах, на которых это не предустановят.
          +8
          Да не фига он не передаёт «абсолютно весь слышимый диапазон», на то он и кодек.
          Да и нафиг, его весь передавать, хотя бы в силу чисто физиологических причин.
          Человеческое ухо = механический фильтр высоких частот совмещенный с регулируемым аттенюатором + дофига канальный анализатор спектра (опять же механический и с регулировкой чувствительности отдельных полос). И тайна церкви инженеров мастеринга и производителей HI-END аппаратуры в том, что с ростом частоты звуковых колебаний, человек утрачивает способность этот рост различать!
          Те. не страдая музыкальным слухом вы с лёгкостью различите разницу между 100 и 101 герц, а вот 10000 и 10100 не факт что затмите вообще. А если и заметите то по причине того что ваша аппаратура, наградила наградила сигнал более низкочастотными гармониками, которые вы прекрасно слышите.

          Так-что вместо передачи оцифрованного сигнала, бывает достаточно передавать функцию описывающую его спектр. Но это ещё не всё, есть ещё масса психоакустических фишек. Одну из которых вам сегодня преподносят под новым соусом. Добавьте к кастрированному спектру «голосового» кодека ВЧ-шума, так что-бы спектр обрывался не резко а плавно. И всё станет намного приятней, но по прежнему будет восприниматься как шум. А теперь добавляем наш шум, только в тем моменты, когда количество высоких частот в спектре исходного сигнала увеличивается… И вуаля, осталось придумать торговую марку (Full-HD Voice уже занято), и впарить.

          Если говорить об андройде, то насколько мне известно, на рутованых машинках, люди уже давно развлекаются с «улучшайзерами» звука.
            +1
            абсолютно весь слышимый диапазон
              +1
              Таки фишка в том «слышимый» это понятие очень растяжимое.
              В чём собственно главное отличие voice-овых кодеков, там более агрессивная психоакустическая модель направленная именно на передачу голоса и даже улучшающая его разборчивость.
              С музыкой же всё гораздо сложнее, тут человек может акцентировать своё внимание на разных её аспектах. Это похоже на зрение, мы можем фокусировать и конвергировать его на разных объектах.
              Так же и со слухом, причём этот процесс происходит не только в мозгу, есть мышцы управляющие как общей чувствительностью так и чувствительностью отдельных частотных полос!

              Вот простой пример, дешевый сабвуфер в машине, вроде басы есть, а через пару минут понимаешь что бубнит то он исключительно на своей резонансной частоте :-)
              Ради чего люди стремятся сохранить звук без потерь, что бы слышать в нём новые и новые грани…
              0
              > А теперь добавляем наш шум, только в тем моменты, когда количество высоких частот в спектре исходного сигнала увеличивается… И вуаля, осталось придумать торговую марку (Full-HD Voice уже занято), и впарить.

              Штука, которая так делает, называется вокодер (она берет тембр исходного сигнала и накладывает на другйо сигнал), она придумывалась еще лет 70 назад, как раз для передачи голоса, но в итоге используется для создания звуковых эффектов в музыке. Человек тем не менее вокодированный голос от живого легко отличает. Не говоря о других видах звуков.
                0
                Нет, вокодер, он немного из другой оперы, описанные мною принципы характерны для психоаккустических процессоров, инхансеров и эксайтеров.
                Но вокодер, хороший пример ядрёного сжатия, если в качестве несущего сигнала использовать шум, то пары десятков полос будет достаточно что бы человек разобрал в этом шипении речь…
              +2
              Очень жаль, что кроме Google почти никто из гигантов не поддерживает свободные технологии.
              Сейчас под эгидой Xiph (разработчики Ogg Vorbis и FLAC) активно разрабатывается кодек Opus, который по характеристикам выглядит очень выигрышно среди конкурентов.
              image
              Не знаю, где на этой картинке будет AAC-ELD, но по сравнению с AAC-LD у Opus на порядок больше очков.
                +3
                Официальная информация по AAC-ELD:
                Bitrates: optimized for bit-rates from 24 to 64 kbit/s and more
                Delay: down to 15 ms at 64 kbit/s, and up to 32 ms at 24 kbit/s
                У Opus такие характеристики:
                Bitrates: 6 — 255 kbps (mono) 12 — 510 kbps (stereo)
                Delay: 5 — 22.5 ms (чем меньше задержка, тем лучше)
                То есть, у Opus и здесь характеристики более привлекательные.
                0
                Почему бы мобильным сетям просто не начать использовать g.711 с некоей надстройкой, оптимизирующей этот кодек для зашумленных радиосетей и больших задержек? Имхо, большего качества звука и не надо в телефонных сетях…
                  0
                  Издеваешься? Использовать 64кбит для 8 килогерц когда тот же gsm или g.729 делает это на 8кбит — это извращение и неадекватная трата ресурсов, особенно если на одной соте висят тысячи абонентов.

                  Из таблички выше следует что наиболее хорош g.722.1C — wideband при минимальном битрейте.
                  0
                  Качество кодеков растет, скорость мобильных ЦПУ растет и только емкость аккумуляторов не растет также быстро!

                  А вообще, по факту, какова потребность в таком кодеке? 99% потребителей вполне себе довольствовались в свое время GSM -> 8 Кбит/сек и проблем не знали! Зато телефоны не требовали подзарядки каждый день и фонили ниже :)
                    +1
                    Название технологии — какая-то низкопробная коммерческая пошлость. Да и реальная потребность в ней — тоже пока сомнительная. Если я говорю по телефону, мне важно слышать собеседника ясно и разборчиво. Весь слышимый спектр в данном случае мне кажется излишним.
                      0
                      Правильно, лучше бы хороший шумодав представили бы) А то говорят, что в айфонах новых два микрофона, чтобы фоновый шум вычищать, так он нифига не вычищается, говорить в метро сложно.
                        +2
                        Вы бы еще в аэропорту под взлетающим боингом поговорили…
                          0
                          Ну так Вас слышат отлично, когда говорите по iPhone 4/4S.
                          А Вам надо использовать вкладыши =)
                          0
                          Есть класс звуков которые плохо влазят в узкий телефонный диапазон. ЕМНИП это свистящие и шипящие. Некоторых товарищей с плохой дикцией в реале разобрать ещё можно, а по телефону уже не очень.
                          Если хотя бы это исправится — уже будет хорошо.
                            0
                            7кГц уже достаточно чтобы свистящие слышать. Шипящие — еще ниже.

                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                        Самое читаемое