Каким стартапам нужен IaaS: Сервисы распознавания речи

    Это одна из наших практических рубрик, в рамках которой мы делимся примерами многолетнего сотрудничества с российскими и зарубежными компаниями. Например, ранее мы рассказывали о кейсах Hotels.ru и PickPoint.

    Сегодня мы хотели бы познакомить вас с Центром речевых технологий (ЦРТ), который вы уже должны были встречать на Хабре — они ведут отличный блог.

    / фото Per-Olof Forsberg CC

    О чем «речь»


    ЦРТ был основан специалистами по акустике, которые вложили в компанию свой научный потенциал и разработки. Труд команды ЦРТ оказался востребован на международном уровне — характеристики продуктов не уступали, а даже превосходили возможности зарубежных аналогов.

    Сегодняшний ЦРТ — это компания с более чем 20-летней историей и ведущий разработчик систем высококачественной записи, обработки и анализа аудио-видео информации, синтеза и распознавания речи. Продукты компании работают на основе ИТ-инфраструктуры «ИТ-ГРАДа», что дает возможность быстро развивать новые продукты и задействовать пул вычислительных ресурсов с высокой доступностью.

    Поскольку ЦРТ регулярно проводит высоконагрузочное тестирование продуктов, а также реализует внешние проекты, выбор в пользу облака является совершенно оправданным.

    — команда ЦРТ

    Теперь посмотрим на сами проекты.

    VoiceFabric


    Это сервис, позволяющий озвучивать синтезированным голосом любую текстовую информацию. Он работает на основе возможностей облака и даже обладает собственным API.

    Сейчас данный интернет-сервис умеет работать с такими сложными конструкциями как омографы. Он понимает тембр и тон с помощью SSML-тегов и распознавать эмоциональные реакции.

    Голоса, озвучивающие текст понимают даже обозначения ":)" и ":(" — они смеются и вздыхают. Реализована поддержка нескольких языков. В их число входит, например казахский.

    VoiceNavigator


    Проект VoiceNavigator — ПО для IVR-систем контактных центров. Умеет распознавать и синтезировать русскую речь (переводит речь в текст и обратно).

    Если говорить простыми словами, то вместо набора нужной цифры на клавиатуре («чтобы узнать о наших услугах, нажмите 1») можно управлять контекстным меню голосовыми командами. Алгоритм распознавания считывает тематику запроса и синтезирует ответ. Технология хорошо подходит и для систем массового обслуживания.

    Виртуальный консультант «Мегафона»


    В рамках сотрудничества с Мегафоном компания ЦРТ предложила решение для службы клиентского сервиса — виртуального консультанта. «Елена» (так решили назвать сервис) может обработать более миллиона запросов в год и экономить клиентам компании тысячи часов, которые те могли бы провести в ожидании ответа живого человека.

    В данный момент «Елена» — пробный проект, в основе которого лежат технологии ЦРТ.

    Существенная часть обращений в контакт-центр носит типовой характер и может быть автоматизирована с помощью современных речевых технологий.

    Работая в тесном сотрудничестве с «МегаФоном», ЦРТ создал не просто справочник с голосовым управлением, а настоящую «персону», общение с которой максимально приближено к естественному.

    — команда ЦРТ
    ИТ-ГРАД
    288,26
    vmware iaas provider
    Поделиться публикацией

    Комментарии 1

      +3
      Спасибо за материал, ещё бы обзор вашего дата-центра глянуть

      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

      Самое читаемое