HD-Voice для сотовой связи — Харитон, Дмитрий, Владимир, Олег, Ирина, Слава!



    Мы включили HD-Voice на сети «Билайн» в Москве. Ниже записи звука до и после, а также технические детали.

    В основе режима HD-voice лежит технология AMR-WB (Adaptive Multi Rate Wadeband) – широкополосное адаптивное кодирование с переменной скоростью, также данный кодек известен как стандарт G.722.22. В теории человек может услышать звуки в диапазоне 20Гц – 20кГц, но на практике достаточно передавать звук в существенно более узком диапазоне. При кодировании речи в AMR-WB используется диапазон частот 50Гц-7кГЦ, этого абсолютно достаточно для полноценной передачи голоса. Для примера, в кодеке AMR используется диапазон 300-3кГц. Метод может использоваться в сетях 2G и 3G.

    Проще говоря, теперь человеческий голос будет звучать естественнее, потому что перестанет «ужиматься» в довольно узкую полосу, необходимость которой была когда-то продиктована ограничениями инфраструктуры. Кроме того, при HD-кодировании, внешние шумы оказывают меньшее воздействие на разборчивость речи.

    Как мы дошли до HD-Voice, и как это работает?


    Человек в состоянии услышать некоторую полосу звуковых частот, обычно её принимают равной 20Гц-20кГц. Передать весь спектр по беспроводным каналам связи без сжатия сложно, поэтому голос без урезания полосы передается только в проводных системах. Для целей сжатия речи используются голосовые кодеки или вокодеры. Их побочным действием является искажение передаваемого голоса за счет ограничения полосы частот голосового сообщения.

    Самым первым голосовым кодеком, использовавшимся в мобильных сетях, был «Full Rate» — FR. Одновременно с FR, был введен и кодек «Half Rate», единственное предназначение которого – увеличение количества одновременно обслуживаемых абонентов, и, как понятно из его названия, он занимает в радиоканале половину полосы кодека FR. Однако качество голоса после перекодирования в FR, было не очень высоким, а для некоторых стран (к примеру, арабских, где скорость речи высокая и много высочастотных звуков), и вовсе неприемлемым. Поэтому кодек FR был переработан, и появился «Enhanced Full Rate», обеспечивающий существенно лучшее качество голоса, при меньшем создаваемом битрейте.

    С ростом проникновения мобильных сетей, требования к качеству голосовых услуг стали расти, и проявилась проблема с ухудшением качества голоса, при низком уровне радиосигнала от базовой станции. Для решения этой задачи, был разработан новый кодек — «Adaptive Multi Rate», который использовал тот же диапазон частот для анализа и сжатия, но алгоритм был реализован таким образом, что битрейт кодека динамически менялся, в зависимости от качества принимаемого сигнала. Благодаря этому, появилась возможность при хороших радиоусловиях предоставить отличное качество голоса, а при плохих – сохранять разговор даже там, где кодеки FR/EFR не смогли бы работать вовсе.

    Все сети 3G работают только с использованием кодека AMR или последующих его реализаций, например AMR-WB. Но поскольку в сети остается большое количество абонентов использующих телефоны поддерживающие только работу с кодеками EFR/HR, сеть 2G продолжает работать со всеми кодеками (FR/EFR/HR/AMR FR/AMR HR) сразу, обеспечивая голосовой связью любой телефон.

    В настоящее время требования к качеству голоса в мобильных сетях продолжают расти, и настало время для использования технологии AMR-WB. Все кодеки, описанные выше, используют для сжатия диапазон частот до 200Гц-3.4кГц, в то время как AMR-WB для кодирования использует полосу голосового сообщения на уровне 50Гц-7кГц., т.е. AMR-WB позволяет передавать в два раза большую полосу частот, что и дает увеличение качества и насыщенности высокими и низкими частотами передаваемого голоса.

    Некоторые характеристики кодеков приведены в таблице:

    Кодек

    Стандарт

    Год создания

    Диапазон сжимаемых частот

    Создаваемый битрейт

    Full Rate — FR

    GSM 06.10

    1990

    200-3400 Hz

    13 kbit/s

    Half Rate — HR

    GSM 06.20

    1990

    200-3400 Hz

    5.6 kbit/s

    Enhanced Full Rate — EFR

    GSM 06.60

    1995

    200-3400 Hz

    12.2 kbit/s

    Adaptive Multi Rate — AMR

    3GPP TS 26.071

    1999

    200-3400 Hz

    4.75 — 12.20 kbit/s

    Adaptive Multi Rate — WideBand — AMR-WB

    3GPP TS 26.190

    2001

    50-7000 Hz

    6.60 — 23.85 kbit/s

    Adaptive Multi Rate-WideBand+ — AMR-WB+

    3GPP TS 26.290

    2004

    50-7000 Hz

    6 — 36 kbit/s (mono)
    7 — 48 kbit/s (stereo)



    Hint для любознательных программистов: образец реализации кодека AMR на языке Си имеется в стандарте 3GPP TS 26.073 (его можно легко найти, скачать и попробовать реализовать).

    На диаграмме ниже можно увидеть сравнение качества голоса, по шкале MOS (Mean Opinion Score), в зависимости от используемого кодека. Шкала MOS – субъективная оценка качества голоса от 0 до 5, где 0 – полное отсутствие слышимости, а 5 – живая речь. Кодек G.711 – применяется в проводной телефонии, то есть это качество которое вы должны слышать со своего городского телефона (если он, конечно, не переведен на IP канал, но это тема совсем другого разговора).



    Update: В комментариях справедливо указали что средняя оценка MOS для кодека G.711 — около 4.1, эта картинка немного искажает действительность.
    Как видно из диаграммы (и учитывая информацию из Update), кодек AMR-WB, обеспечивает, при хороших радиоусловиях, качество голоса аналогичное тому, к которому мы привыкли при использовании проводного домашнего телефона.

    Для примера – два фрагмента музыкальной композиции, которые сжимались кодеками AMR и AMR-WB, можете сами сравнить качество звука, и визуально оценить разницу в звуковой картине, создаваемой разными кодеками.

    Верхний трек, кодированный в AMR

    Нижний трек, кодированный в AMR-WB

    Тесты


    Мы не первые, кто запускает эту технологию в России, поэтому кое-какие наработки уже были. Наш первый участок сети с HD-Voice был построен в пределах МКАД, на оборудовании Ericsson. Активирование AMR-WB заняло длительное время: сначала проходило тестирование на одном контроллере (с многочисленными драйв-тестами по измерению качества речи). И даже после того как на одном контроллере все было протестировано, последующая активация проходила поэтапно, контроллер за контроллером. Весь процесс активирования занял почти полгода.

    Вот эталонные сэмплы с финала тестов, которые оценивались аппаратно с помощью точных замеров в разные моменты.

    Это уже работает?


    Да, сейчас технология реализована в сети 3G для Москвы. Для того, чтоб воспользоваться режимом, не нужно производить дополнительных настроек, он активизируется сам, если оба абонента находятся в сети 3G и оба их телефона поддерживают работу кодека.



    На схеме изображены условия, которые нужны для функционирования AMR-WB. Сейчас как говорилось выше, кодек запущен в сети 3G, следующий этап обеспечить работу кодека между сетью 2G и 3G, далее — между сетями и между операторами.

    Какие устройства поддерживаются?


    Список. Осторожно, под спойлером много букв.
    Alcatel One Touch 903
    Alcatel One Touch 916/916D
    Alcatel One Touch 918
    Alcatel One Touch 983
    Alcatel One Touch 985/985D
    Alcatel One Touch 991/991D/991T
    Alcatel One Touch 992D
    Alcatel One Touch 993/993D
    Alcatel One Touch 995/996
    Alcatel One Touch Idol
    Alcatel One Touch Idol Ultra
    Alcatel One Touch Scribe Easy
    Alcatel One Touch Scribe HD
    Alcatel One Touch Star
    Alcatel One Touch Tribe
    Alcatel One X'POP
    Apple iPhone 5
    Apple iPhone 5S
    Apple iPhone 5C
    BlackBerry Q10
    BlackBerry Q5
    BlackBerry Torch 9810
    BlackBerry Z10
    BlackBerry Z30
    HTC Desire 500
    HTC ChaCha
    HTC Desire C
    HTC Desire HD
    HTC Desire S
    HTC Desire X
    HTC Desire Z
    HTC EVO 3D
    HTC Incredible
    HTC One
    HTC One mini
    HTC One S
    HTC One SV
    HTC One V
    HTC One X
    HTC One X+
    HTC One XL
    HTC One (M8)
    HTC Radar
    HTC Raider
    HTC Rhyme
    HTC Sensation
    HTC Sensation XE
    HTC Sensation XL
    HTC Titan
    HTC Touch HD
    HTC Wildfire S
    HTC Windows Phone 8X
    HTC Windows Phone 8S
    Huawei Ascend D Quad
    Huawei Ascend D2 LTE (VoLTE)
    Huawei Ascend G510
    Huawei Ascend G740
    Huawei Ascend P1 U9200
    Huawei Ascend P2
    Huawei Ascend P6
    Huawei Boulder U8350
    LG A310
    LG Nexus 4 E960
    LG Nexus 5
    LG Optimus 3D
    LG Optimus G
    LG Optimus G Pro
    LG Optimus L4 II
    LG Optimus L5
    LG Optimus L5 II
    LG Optimus L7
    LG Optimus L7 II
    LG Optimus L9
    LG Optimus LTE2 F160LV (VoLTE)
    LG Optimus F7
    LG Optimus F180S (VoLTE)
    LG Optimus Vu2 F200 (K,L,S) (VoLTE)
    LG Optimus Vu3 F300 (K,L,S) (VoLTE)
    LG Optimus GX F310L (VoLTE)
    LG Optimus G2 F320S (VoLTE)
    LG Optimus G Pro F240S (VoLTE)
    LG Optimus LTE III F260S (VoLTE)
    LG Optimus G Flex F340S (VoLTE)
    LG Optimus 3D Max (P720)
    LG Optimus 3D (P920)
    LG Optimus 4X HD (P880)
    LG Prada (P940)
    LG Prada 3.0
    Motorola Quench
    Motorola RAZR (XT910)
    Motorola RAZR i (XT890)
    Motorola Moto G
    Nokia 300
    Nokia 301
    Nokia 302
    Nokia 500
    Nokia 515
    Nokia 600
    Nokia 603
    Nokia 700
    Nokia 701
    Nokia 808 PureView
    Nokia 5230
    Nokia 5330 Mobile TV Edition
    Nokia 5530 XpressMusic
    Nokia 5630 XpressMusic
    Nokia 5730 XpressMusic
    Nokia 6260 Slide
    Nokia 6600i slide
    Nokia 6700 classic
    Nokia 6700 slide
    Nokia 6710 Navigator
    Nokia 6720 classic
    Nokia 6760 slide
    Nokia 6790 slide
    Nokia 7230
    Nokia Asha 300
    Nokia Asha 301
    Nokia Asha 302
    Nokia Asha 303
    Nokia Asha 311
    Nokia C2-01
    Nokia C3-01 Touch and Type
    Nokia C5-03
    Nokia C5-04
    Nokia C6-00
    Nokia C6-01
    Nokia C7-00
    Nokia E5-00
    Nokia E52
    Nokia E55
    Nokia E6-00
    Nokia E63
    Nokia E7 Communicator
    Nokia E7-00
    Nokia E71x
    Nokia E72
    Nokia E73 Mode
    Nokia Lumia 510
    Nokia Lumia 520
    Nokia Lumia 520.2
    Nokia Lumia 521
    Nokia Lumia 610
    Nokia Lumia 610 NFC
    Nokia Lumia 620
    Nokia Lumia 625
    Nokia Lumia 710
    Nokia Lumia 720
    Nokia Lumia 800
    Nokia Lumia 810
    Nokia Lumia 820
    Nokia Lumia 822
    Nokia Lumia 900
    Nokia Lumia 920
    Nokia Lumia 920T
    Nokia Lumia 925
    Nokia Lumia 925 Superman Edition
    Nokia Lumia 925T
    Nokia Lumia 928
    Nokia Lumia 929 LTE-A (Cat 4)
    Nokia Lumia 1020.2
    Nokia Lumia 1020 3G
    Nokia Lumia 1020 LTE
    Nokia Lumia 1520
    Nokia N7
    Nokia N8
    Nokia N86 8MP
    Nokia N9
    Nokia N97
    Nokia N97 mini
    Nokia X3-02
    Nokia X5
    Nokia X6-00
    Nokia X7-00
    Samsung Galaxy Star
    Samsung Galaxy Light
    Samsung Ativ S
    Samsung Galaxy Ace
    Samsung Galaxy Ace 2
    Samsung Galaxy Express
    Samsung Galaxy Fame
    Samsung Galaxy Mini
    Samsung Galaxy Mini 2
    Samsung Galaxy Nexus
    Samsung Galaxy Note
    Samsung Galaxy Note II
    Samsung Galaxy Note 3
    Samsung Galaxy Note 10.1
    Samsung Galaxy S II
    Samsung Galaxy S III
    Samsung Galaxy S4
    Samsung Galaxy S4 Mini
    Samsung Galaxy S5
    Samsung Galaxy S Advance
    Samsung Galaxy S Plus
    Samsung Galaxy W
    Samsung Galaxy Y
    Samsung Omnia 7
    Samsung Omnia Pro B7350
    Samsung S5610
    Samsung Wave 3
    Samsung Trend Plus
    Sony Ericsson Elm
    Sony Ericsson Hazel
    Sony Ericsson Live with Walkman
    Sony Ericsson Xperia X8
    Sony Ericsson Xperia X10 Mini
    Sony Ericsson Xperia X10 mini pro
    Sony Ericsson Xperia acro
    Sony Ericsson Xperia active
    Sony Ericsson Xperia Arc
    Sony Ericsson Xperia arc S
    Sony Ericsson Xperia mini
    Sony Ericsson Xperia Mini Pro
    Sony Ericsson Xperia neo
    Sony Ericsson Xperia neo V
    Sony Ericsson Xperia Play
    Sony Ericsson Xperia ray
    Sony Ericsson W995
    Sony Xperia A SO-04E
    Sony Xperia acro S
    Sony Xperia E
    Sony Xperia E dual C1605
    Sony Xperia Go (ST27i)
    Sony Xperia i1 HSPA+ C6902
    Sony Xperia i1 LTE
    Sony Xperia ion
    Sony Xperia J
    Sony Xperia L
    Sony Xperia M
    Sony Xperia M35t (VoLTE)
    Sony Xperia miro
    Sony Xperia P
    Sony Xperia S
    Sony Xperia Sola
    Sony Xperia SP
    Sony Xperia T
    Sony Xperia Tipo
    Sony Xperia Tipo Dual
    Sony Xperia U
    Sony Xperia V
    Sony Xperia Z
    Sony Xperia ZL
    Sony Xperia ZR
    Sony Xperia Z1
    Sony Xperia Z1S (T Mobile US only)
    Sony Xperia Z1 Compact LTE-A D5503
    Sony Xperia Z2 LTE-A D6543/D6503
    TechFaith Wildfire 80
    ZTE Blade V880
    ZTE Crescent (San Francisco 2 on Orange)
    ZTE Era
    ZTE F160 Atlanta
    ZTE Grand X
    ZTE Grand X IN
    ZTE Orbit
    ZTE R252 / Orange Tara
    ZTE Kis Pro / Orange Zali
    ZTE Skate (Monte Carlo on Orange)
    ZTE Smart Netphone 701
    ZTE Tania
    ZTE TMN smart A15


    Проблемы распознавания


    Человеческая речь такова, что в радиоэфире и на узкой полосе аудиоспектра плохо различаются звуки «С» и «Ф». Также страдают пары «Т» и «П», «М» и «Н». Отсюда мнемонический системы с именами: «Диктую, номер два-ноль-ноль три Ольги, как понял, приём?». Отсюда же растут вещи вроде назначения наиболее ответственным частям позывных с «р» — например, снайпер, который ни в коем случае не должен перепутать свой позывной, скорее всего, будет «тридцать третьим», потому что в эфире это очень хорошо различимо в условиях узкой полосы.

    Также с HD-Voice растёт узнаваемость голоса. Это важно и для личного общения, и для набирающей популярность дополнительной аутентификации по голосу, к примеру, в банках.
    ВымпелКом (Билайн)
    Company

    Comments 33

      0
      Харитон, нет? :) (без испанского налёта)
        0
        Исправил :)
          +1
          я больше в шутку :) Но новый вариант приятнее.
        +1
        Когда опсос внезапно включил HD-Vоice, я сперва подумал, что телефон сломался — настолько изменился голос :)
        Ощущение, будто человек рядом стоит. Так что теперь при смене телефона или опсоса у меня появилось дополнительное обязательное условие — наличие HD-Voice.

        А как у вас с HD Voice interconnect — при связи со стационарными или другими мобильными сетями HD Voice работает?
          0
          В проводных сетях работают другие кодеки, поэтому такого эффекта не получится. С сетями других операторов HD-Voice интерконнект в проработке (в статье это упоминается).
            0
            В дополнение — чтобы реализовать такие сценарии, нужно очень много доводок и проверок совместимости с разным железом, в том числе довольно старым. Скоро мы расскажем про тестовую зону для таких решений и покажем железо.
            +2
            Когда будет VoLTE? что бы телефон не переключался в 3G при звонке из LTE?
              +1
              На тему VoLTE готовится отдельный пост. Могу сказать что в нашей лаборатории (в Тестовой Зоне) все уже проверено и работает.
                0
                iOS 7/8 поддерживает?
                  0
                  во вкладке обозначены терминалы которые поддерживают кодек, среди них Apple iPhone 5 / Apple iPhone 5S / Apple iPhone 5C. Соответственно в актуальных релизах iOS (7.x / 8) работает.
                    0
                    я говорил не о теме поста в о Voice Over LTE
                      0
                      Это тогда нужно будет обсудить в посте про VoLTE, коллеги обещают в ближайшее время подготовить.
                    0
                    ответ по поддержке VoLTE в iPhone здесь, в комментариях к статье

                    habrahabr.ru/company/beeline/blog/229093
                +1
                Кодек G.711 – применяется в проводной телефонии, то есть это качество которое вы должны слышать со своего городского телефона


                А как применяется? Мне казалось, что в проводном телефоне вообще аналоговый сигнал. Ошибался?
                  +1
                  Аналоговые телефонные станции (к примеру декадно-шаговые или координатные) когда то были основной городских сетей. Но уже достаточно давно все они заменены на цифровые, а там где цифра — есть цифро-аналоговое преобразование и используется какой-то кодек для оцифровки голоса.
                    +1
                    Аналоговый сигнал идёт от телефонного аппарата ровно до цифровой АТС, которая осуществляет преобразование в цифру посредством G.711 и утрамбовывает получившиеся данные в таймслот E1. После прохождения через сеть оператора осуществляется обратное преобразование в аналог. Это если совсем на пальцах.
                    Разумеется, аналоговые АТС (те же декадно-шаговые, координатные), никакого кодирования не делают, поскольку они аналоговые.
                    0
                    если аппарата нет в списке в статье но реально кодек там есть — работать не будет или все же будет?
                    спрашиваю потому что список почти дословно повторяет en.wikipedia.org/wiki/List_of_Smartphones_using_HD_Voice

                    и например не указана Xperia Z Ultra хотя судя по www-support-downloads.sonymobile.com/c6833/whitepaper_EN_c6802_c6806_c6833_c6843_xl39h_8.pdf, там поддерживается
                    зато есть Xperia Z1S которая разве что в роуминге или с ебея в России появится

                      0
                      Скорее всего должно работать, хотя точно может сказать только производитель телефона. Аппаратно терминал может все поддерживать, но локализованная версия прошивки может к примеру иметь ограничения на использование функционала. Список приведенный в статье конечно не претендует на эталонность.
                      0
                      А когда в других регионах начнет появляться? Например, Урал)
                        +2
                        По плану — будем анализировать результаты запуска в Москве, и с учетом этого опыта включать по стране. Точные сроки для конкретных регионов сказать пока не возьмусь, очень много влияющих факторов.
                        0
                        Voice всё-таки произносится с 'й', выбирайте.
                          0
                          HD — «аш ди». Или вы по написанию? Это странно.
                          0
                          И ни слова о зависимости качества от процента потерь пакетов.
                            0
                            Статья немного не об этом, поэтому на качестве канала акцентов не делалось. Взаимосвязь между качеством голоса и качеством IP канала (не только потери пакетов, но и пропускная способность, задержки, джиттеры) по которому он передается — сохраняется при использовании любых кодеков. Мы для предоставления голосовых сервисов строим сети с качеством каналов, которые требует производитель оборудования, поэтому стандартное значение потери пакетов — менее 2%, при таких значениях влияние на качество голоса, потери пакетов практически не оказывают.
                          • UFO just landed and posted this here
                              0
                              Если говорить про качество передаваемого голоса, то конечно указанный вами кодек лучше. Но в мобильных беспроводных сетях существуют жесткие ограничения, связанные с доступной шириной канала для передачи данных, и с качеством радиосигнала который используется для передачи этих данных. С этой точки зрения динамические кодеки AMR, являются лучшим компромиссом между качеством голоса, и помехозащищенностью кодека.
                              0
                              Что-то долго вы. Мега еще в 2012 запустили HD Voice
                                +1
                                У вас табличка по MOS неверная! en.wikipedia.org/wiki/Mean_opinion_score
                                на самом деле у G.711 MOS порядка 4,1
                                  0
                                  Согласен, с MOS=3,4 несколько погорячился. Взял табличку от одного из вендоров оборудования, не перепроверив значения.
                                  Добавил Update по тексту статьи.
                                  0
                                  Я правильно понимаю, что с включенным Харитон-Дмитрием буду при звонке в кол-центры слышать нормальные мелодии, а не звук граммофона с поцарапанной пластинки?
                                    0
                                    Колл Центр работает на фиксированных телефонных линиях, поэтому там такие кодеки не используются. Такое качество сейчас возможно только при звонках мобила-мобила.
                                      0
                                      То есть мелодии «Ваш-звонок-очень-важен-для-нас» так сильно искажаются в ходе прохода сигнала через цифровые АТС стационарной связи?
                                        0
                                        эти преобразования тоже дают свой вклад. Но если звонок делается с мобильного телефона в зоне слабого радиопокрытия, или пергруженной сети — фактор использованного кодека (к примеру AMR-HR с низкой скоростью кодирования) будет основным влияющим на качество речи.

                                  Only users with full accounts can post comments. Log in, please.