Голосовая биометрия в контакт-центре банка. Кейс внедрения



    Всем привет! В прошлом году мы внедрили свое решение для голосовой верификации пользователей контакт-центров VoiceKey.Agent в Приорбанк (это один из крупнейших коммерческих банков Беларуси, входящий в австрийскую группу «Райффайзен») и теперь хотим рассказать вам о том, как мы это сделали и зачем это все понадобилось банку. На территории России и СНГ это второе внедрение голосовой биометрии в КЦ банка, поэтому мы стали практически первопроходцами.

    Зачем банку биометрия


    Не будем в очередной раз рассказывать, что традиционные технологии верификации пользователя (то есть подтверждение личности по знаниям: паролям, пин-кодам, кодовым словам и пр.) громоздки и не дают гарантированного результата. Крайне сложно удостовериться, действительно ли на другом конце провода находится тот самый человек, за которого он себя выдает. Оператор контакт-центра может лишь задавать уточняющие вопросы и сопоставлять голос человека с его полом, возрастом и другими особенностями. Достаточно очевидно, что для защиты финансовой информации этого мало.
    Поэтому банки, страховые компании, пенсионные фонды и т.п. ищут способы оптимизации удаленного обслуживания через КЦ. Например, растет количество обращений клиентов в контакт-центры банков с запросами, требующими персональной идентификации. Так, если в ноябре-декабре 2007 года в КЦ Приорбанка было зафиксировано 46% звонков с необходимостью запроса персональной информации, то в аналогичный период 2015 года количество таких обращений увеличилось до 68% от общего количества всех звонков, а это уже два звонка из трех.

    Типовые вопросы, которые задают клиенты по телефону


    На сегодняшний день операторы контакт-центра Приорбанка ежемесячно обрабатывают десятки тысяч звонков, более половины обращений — запросы информации по счетам и операциям. Основные вопросы: «почему не работает карточка», «какая задолженность по кредиту», «почему не проходит операция» и так далее. Эти вопросы нельзя решить без подтверждения личности клиента — по законодательству информация по счетам предоставляется только их владельцам.

    Подобные сведения не раз пытались получить не владельцы счета, а третьи лица. Вот поэтому у позвонившего в банк человека всегда спрашивают паспортные данные, номер карточки, девичью фамилию матери и так далее. На выяснение этих вопросов уходит в среднем 30−40 секунд на одного клиента.

    Получается, что, во-первых, опасность выдать информацию не тому человеку довольно серьезная, во-вторых, растет среднее время обслуживания клиента, а это один из основных рабочих показателей любого КЦ.

    Таким образом, банку нужно минимизировать время обслуживания одного клиента, повысить уровень защиты данных и сделать все это так, чтобы клиенту все еще было удобно и просто получить в КЦ необходимую информацию. Для решения этих задач мы предложили Приорбанку VoiceKey.Agent.

    Как работает VoiceKey.Agent




    При каждом вызове (входящем или исходящем) в момент начала разговора с оператором запускается проверка пользователя в фоновом режиме и собираются данные о его голосе. Затем информация поступает в обработку на сервер и сравнивается непосредственно с образцом голоса клиента, хранящимся в системе. Результат проверки отображается в интерфейсе оператора контакт-центра. Это процесс называется верификацией (есть еще такое понятие, как идентификация, и их нужно различать).

    Архитектуру VoiceKey.AGENT имеет клиент-серверную и предоставляет гибкие возможности для интеграции c контакт-центром и CRM.



    Процесс надёжен настолько, что позволяет отличать, например, голоса близнецов или звонок пародиста. Система за несколько секунд сверит голос с эталоном и сообщит, что верификация не пройдена. Система языконезависима, поэтому клиент банка может говорить на любом доступном ему языке.

    Но чтобы в базе появились голосовые отпечатки (или эталоны голосов) клиентов, их нужно сначала записать.

    Как формировалась база голосов клиентов в Приорбанке?


    Предусмотрено несколько процессов при работе с голосовыми эталонами:

    • первоначальное наполнение базы голосовыми эталонами клиентов на основании записей их звонков в контактный центр. Причем при создании эталона клиент должен подтвердить свое согласие на его (эталона) запись;

    • обновление голосовых эталонов;

    • верификация клиентов по голосу.

    База данных с голосовыми эталонами клиентов формировалась в процессе их обращений в контакт-центр банка по телефону. Если во время разговора с оператором клиент мог подтвердить свою личность стандартным способом (по паспортным данным, секретным словам, номерам договоров и пр. деталям), то, когда набиралось достаточное количество речевого материала, система создавала цифровой эталон на базе уникальных особенностей его голоса: акцента и скорости речи, произношения и пр. Также учитывались и физические особенности: речевой такт, форма и размер рта, строение носа. Таким образом, уже при следующем вызове в КЦ процедура верификации клиента существенно сокращалась по времени за счёт фонового подтверждения личности по голосу.

    Регистрация голосового эталона




    • При звонке клиент идентифицируется по номеру телефона (если он звонит с мобильного телефона, номер которого зарегистрирован в банке).

    • Дальше он проходит процедуру стандартной аутентификации по знаниям ФИО, даты рождения, номера паспорта и договора, секретной фразы. В общем, вплоть до того, как зовут кошку.

    • В процессе разговора система накапливает нужное для создания голосового эталона количество речи (обычно около 40 секунд чистой речи), и когда собрано достаточно, информирует о готовности создать эталон. Оператор нажимает на кнопку, и если сведения, которые сообщил о себе клиент, совпадают с данными из систем банка, оператор сохраняет голосовой эталон. В противном случае сохранения не происходит. Согласие от клиента на создание голосового эталона банк получает заблаговременно, на этапе подписания клиентом договора на обслуживание.

    Пример диалога клиента с оператором:


    Верификация клиента




    Клиент звонит и его идентифицируют по номеру мобильного телефона. Если для него уже создан голосовой эталон, то дальше система начнёт:

    • процедуру верификации, если нет, то смотри историю про регистрацию нового эталона. Оператор задаёт несколько простых вопросов клиенту (просит представиться и указать дату рождения).

    • В течение нескольких секунд разговора, когда накоплено достаточное количество чистой речи клиента (7–9 сек.), система сравнивает его голос с эталоном и показывает результат оператору («свой», «чужой», «не уверена»).

    • Оператор либо заканчивает опрос, либо продолжает, потому что система «не уверена», что это свой, либо мягко отказывает клиенту, потому что он «чужой».

    Пример успешной верификации:


    Если необходимо, оператор может вручную перезапустить процедуру биометрической проверки клиента, например, если в процессе верификации в разговор вмешивался третий участник.



    Или перевести клиента на своего руководителя или службу безопасности:



    После завершения процедуры верификации система больше «не слушает» разговор, и её ресурсы не задействуются.

    Этапы и особенности внедрения


    • Разработка технического задания, проектирование и внедрение.
    • Интеграция с CRM.
    • Калибровка системы.
    • Тестирование / опытная эксплуатация.
    • Сдача работ.

    Для определения решения в системе настраиваются три порога («первый», «второй» и «обогащение»). Если результат сравнения выше первого порога, то система считает, что клиент «свой», если ниже второго — клиент «чужой», если между — это значит, что система не может наверняка быть уверена в своем решении.

    Если при сравнении результат выше первого порога и выше порога «обогащение», то система автоматически обновляет эталон голоса. Это позволяет поддерживать эталоны в актуальном состоянии.

    Безусловно, 100% результат никакая биометрическая система не выдать не может, так как является вероятностной. Иногда, хотя и очень редко, случаются ошибки.
    Они бывают разных типов.

    Типы ошибок


    Ошибки бывают первого и второго типа или, иначе, ложного пропуска «чужого» (False Acceptance Rate, FAR) и ошибки ложного отказа «своему» (False Reject Rate, FRR). Эти ошибки взаимосвязаны, и настройка биометрических систем требует нахождения «компромисса» между уровнями этих ошибок, чтобы максимально удовлетворять задаче.

    Голосовая биометрия может быть применена в различных приложениях. Например, для верификации пользователей при разговоре с оператором контакт-центра, автоматической верификации по голосу в IVR, предоставления доступа пользователю в мобильное приложение (используется совместно с другими видами биометрии: отпечаток пальца или лицо), идентификации мошенников по голосу (антифрод) и пр.

    Ссылки:
    » Подробнее о биометрической платформе VoiceKey.
    » Сообщение о проекте на белорусском Interfax.
    Центр речевых технологий (ЦРТ)
    71,35
    Компания
    Поделиться публикацией

    Комментарии 13

      +1

      Пояните пожалуйста одну вещь: насколько я знаю, для отпечатков пальцев сегодня не существует технологии их хранения в таком виде, чтобы


      • отпечаток можно было использовать для аутентификации клиента
      • в случае компрометации вашей базы взломщик не получил бы все отпечатки в их исходном виде

      Т.е., если пароли хранятся в виде хешей с солью, то для отпечатков это не так. А что для отпечатков голоса?

        0
        Голосовые отпечатки представляют собой только те характеристики, которые отвечают за индивидуальные особенности голоса человека. Но это не сам голос или информация о том, что сказано. Поэтому восстановить по отпечатку голоса исходное речевое сообщение в принципе невозможно.

        Во-вторых, голосовые отпечатки хранятся в анонимном виде, т.е. даже получив его, невозможно сопоставить его с персональными данными клиента системы. База данных, отвечающая за сопоставление отпечатков и персональных данных, хранится в другой системе, которая защищена столь же надежно, сколько и собственно финансовые данные клиентов банка.
          0

          Т.е. это все-таки не отпечаток ни в каком виде, а скорее ближе к хешу. Понятно, спасибо.

        0
        Можно ли по информации голосового отпечатка синтезировать голос клиента?
          0
          Абсолютно точно нет. Голос по хранящейся информации восстановить нельзя.
            0
            Не верю. Если как-то закодировали, значит можно как-то раскодировать и подделать.
              0
              Вы по sha256 чек сумме сможете узнать размер исходного файла?
          0
          Если у клиента заложило нос (простудился, к примеру) какова вероятность всё же аутентифицировать его по такту речи или каким-то другим речевым характеристикам?
            0
            Зависит от степени заложенности носа)) Если человек сильно охрип или произошли значительные изменения голоса (т.е. такие, что вы бы сами не смогли узнать своего знакомого, который позвонил вам в таком состоянии), то биометрическая система его не опознает. Но это приведет не к отказу обслуживать клиента, а к верификации традиционным способом: больше вопросов, кодовые слова и проч.
              0
              А после дополнительной успешной верификации, подобные значительные изменения в голосе будут учитываться для последующего распознавания? Допустим, через месяц клиент опять простудился.
              Иными словами — может ли у одного клиента храниться несколько вариантов «отпечатков» голоса?
                0
                Например, он простудился и позвонил в банк, где и произошла запись его голоса.
                  0
                  Запись голоса надо производить в здоровом состоянии) А то потом все время придется звонить в банк больным.
                  0
                  Вообще, в системе настраиваются три порога («первый», «второй» и «обогащение»). Если результат сравнения ниже первого порога, то система считает, что клиент «чужой», если выше второго — клиент «свой», если между — это значит, что система не может наверняка быть уверена в своем решении.

                  Так вот, когда клиент звонит сильно охрипший, то его голос оказывается между первым и вторым порогами, и модель не обогащается.

                  На верхней границе «второго» порога есть еще зона «обогащения». Если при сравнении результат оказывается в этой зоне, то система автоматически обновляет эталон голоса. Это позволяет поддерживать эталоны в актуальном состоянии.

            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

            Самое читаемое