Центр речевых технологий (ЦРТ), Санкт-Петербург / Статьи / Хабр

Компания Центр речевых технологий (ЦРТ) временно не ведёт блог на Хабре

Статьи 34Посты

Anisotropic 15 янв 2014 в 13:28

Конкурс «Родная речь-2014»: на старт, внимание, марш!

1 мин

3.4K

Блог компании Центр речевых технологий (ЦРТ)Алгоритмы*

Всем привет!

15 января открылась регистрация участников ежегодного конкурса разработчиков – «Родная речь-2014». Победитель получит 120 000 рублей, серебряный призер – iPhone 5, а финалист, занявший третье место, – iPad 4.

Заполнить заявку самостоятельно или от имени команды можно на сайте деловой сети Marketing to Innovation, Education, Science, оказывающей конкурсу техническую поддержку.

Процедура регистрации подробно описана в инструкции.

Читать дальше →

-1

NataliaMihaylova 26 дек 2013 в 17:52

Станиславский для робота. Как использовать возможности эмоционального синтеза

3 мин

5.9K

Блог компании Центр речевых технологий (ЦРТ)Звук

Поздравляем всех с наступающими праздниками! Этот пост будет не столько технический, сколько сказочно-новогодний. По традиции, накануне Нового года мы придумываем подарки для наших партнеров и клиентов. Но также нам хочется сделать что-то приятное для более широкой аудитории. Самый лучший подарок – сделанный своими руками. А дарить подарки приятнее всего детям. Поэтому в этом году мы придумали проект «Робот читает сказки детям». Мы взяли 12 новогодних сказок, озвучили их с помощью синтеза речи и разместили на нашем портале Voice Fabric.

Как известно, Центр речевых технологий создал несколько голосов TTS (text-to-speech), которые используются в системах IVR контакт-центров, системах голосового оповещения, мобильных приложениях — «Radio RSS» и «Читатель».

Как подбирались голоса

Всего в команде «голосовых роботов» на данный момент 5 женских и 2 мужских голоса. У каждого голоса свое имя. Преобладание женских голосов объясняется тем, что в информационных системах именно женские голоса комфортнее для восприятия пользователями.
Индивидуальность каждого голоса обеспечивается несколькими факторами. Во-первых, тембр голоса сохраняется при студийной записи диктора, голос которого используется в качестве прототипа. Во-вторых, мы сохраняем интонационные особенности голоса диктора, применяя статистически рассчитанную модель голоса, которая создается именно по студийным фонограммам этого диктора.В итоге, для озвучивания сказок мы отобрали 6 голосов: Владимира, Анну, Юлию, Марию, Викторию и Александра.Выбирая сказки, мы руководствовались, конечно, новогодне-рождественской темой, отсутствием копирайтов, а также личными предпочтениями. Коллекция получилась пестрая: это и известные русские народные сказки («Два Мороза», «Лисичка-сестричка», «Снегурочка»), и европейская классика братьев Гримм и Г.Х. Андерсена. Также мы нашли менее известные у нас, но очаровательные рождественские сказки «Портной из Глостера» и «Мышонок Твикли». И, конечно, не могли обойти стороной замечательную притчу О. Генри «Дары волхвов», которая не совсем сказка, но очень трогательная история о настоящей любви.

Читать дальше →

NataliaMihaylova 17 дек 2013 в 15:50

«Родная речь-2014» — шанс заявить о себе для молодых разработчиков

2 мин

2.6K

Блог компании Центр речевых технологий (ЦРТ)

Победители получат ценные призы и работу мечты!

Весной 2014 года пройдет второй открытый конкурс по разработке речевых систем для молодых ученых – «Родная речь». Победитель получит 120 000 рублей или участие в международной летней школе по речевым технологиям, серебряный призер – iPhone 5, а финалист, занявший третье место, – iPad 4.

График проведения конкурса:

15 января 2014 — начало регистрации участников
15 февраля 2014 —открытие доступа к конкурсной базе, начало работы
1-3 апреля 2014 — полуфинал
26-28 апреля — финал, который состоится в Санкт-Петербурге

Ознакомиться с условиями участия и получить всю необходимую информацию можно на странице конкурса на сайте ЦРТ spch.pro/x1fm2
Обязательным условием участия является вступление в группу ЦРТ ВКонтакте vk.com/speechpro

Для того чтобы принять участие, достаточно иметь навыки программирования, живое, творческое мышление и желание решать интересные, нестандартные задачи на стыке нескольких дисциплин, таких, как динамическое программирование, статистическое моделирование и др.

Организатор «Родной речи» – компания «Центр речевых технологий», абсолютный лидер российского и значимый игрок международного рынка речевых технологий и мультимодальной биометрии, ведущий разработчик речевых систем в России. Всем трем лауреатам конкурса будет предложено присоединиться к команде ЦРТ.

Читать дальше →

DemiurgeSerge 13 дек 2013 в 11:10

Речевые технологии. Голосовая биометрия для чайников на примере работы в контактном центре

8 мин

26K

Блог компании Центр речевых технологий (ЦРТ)Разработка систем связи*

Туториал

Всем привет.
Недавно я написал вот такую статью про распознавание слитной речи, а сейчас хотел бы написать про голосовую биометрию, т.е. подтверждение личности человека по голосу и узнавание человека по голосу.

Читать дальше →

ryaboshlyk 4 окт 2013 в 13:36

Radio RSS для iPhone и iPad: все актуальные новости за рулем. Уже два года!

1 мин

4.7K

Блог компании Центр речевых технологий (ЦРТ)Разработка мобильных приложений*

Друзья, уже ровно два года мы озвучиваем все самые актуальные новости всех самых популярных российских новостных порталов (Хабр в том числе!) при помощи бесплатного мобильного приложения Radio RSS для iPhone и iPad.

Расширенная версия приложения дает доступ к более чем 50-ти популярным новостным порталам, а теплый ламповый проигрыватель помогает переключаться между каналами.

Читать дальше →

ryaboshlyk 11 сен 2013 в 14:30

Дорогой «Читатель», тебе исполнился год. Поздравляем!

2 мин

4.3K

Блог компании Центр речевых технологий (ЦРТ)

Друзья! Нашему приложению «Читатель» на iPhone и iPad исполнился год!

Скачать в iTunes: itunes.apple.com/ru/app/id533851555 В конце поста — подарок.

За год мы приобрели 100 тыс. пользователей и их количество продолжает расти. Спасибо вам, друзья!

Читать дальше →

-3

DemiurgeSerge 6 авг 2013 в 13:08

Риски использования распознавания речи от Google в своих бизнес проектах

4 мин

21K

Блог компании Центр речевых технологий (ЦРТ)Asterisk*Разработка систем связи*

Всем привет.

По мотивам статьи «Самообслуживание клиентов с помощью google ASR»
Хотел бы вам рассказать, какие есть риски для бизнеса при использовании распознавания речи от Google для своего call-центра.

Я представляю компанию «Центр речевых технологий» (ЦРТ) и мы занимаемся технологиями синтеза и распознавания русской речи и в первую очередь, как раз делаем решения по автоматизации call-центров.
Речевыми технологиями мы занимаемся уже на протяжении 20 лет. Сейчас над этим трудится порядка 70-80 ученых и программистов, плюс нам помогают речевые кафедры ведущих ВУЗов страны, плюс у нас есть собственная кафедра речевых технологий в ИТМО — растим своих молодых ученых.

И в этом посте я проведу параллели между распознаванием речи от ЦРТ и Google, относительно применения его в корпоративном секторе (call — центры).

Читать дальше →

-1

DemiurgeSerge 27 июн 2013 в 11:38

Речевые технологии. Распознавание слитной речи для чайников на примере IVR систем

9 мин

38K

Блог компании Центр речевых технологий (ЦРТ)Звук

Туториал

Всем привет.
По роду своей профессиональной деятельности я занимаюсь внедрением проектов на основе речевых технологий. Это синтез и распознавание речи, голосовая биометрия и анализ речи.
Мало кто задумывается, насколько эти технологии уже присутствуют в нашей жизни, хоть и далеко не всегда – явно.
Постараюсь популярно объяснить вам, как это работает и зачем это вообще нужно.
Подробно начну с распознавания речи, т.к. это более близкая к повседневной жизни штука, с которой многие из нас встречались, а некоторые уже постоянно пользуются.

Читать дальше →

+14

Pimpania 19 апр 2013 в 13:22

«Центр речевых технологий» предоставляет речевые базы для создания прототипа системы распознавания речи

2 мин

7.5K

Блог компании Центр речевых технологий (ЦРТ)Программирование*Алгоритмы*

Recovery Mode

С целью найти талантливых специалистов, готовых посвятить себя деятельности по развитию речевых технологий в России, Центр речевых технологий (ЦРТ) предоставляет собственные речевые базы. Они содержат не просто звуковые файлы с текстовками, но и разметку по времени, выполненную специалистами ЦРТ.

Читать дальше →

mulai 12 окт 2011 в 13:14

FreeSWITCH + mod_unimrcp + VoiceNavigator. Синтез и распознавание русской речи во FreeSWITCH

5 мин

9.3K

Блог компании Центр речевых технологий (ЦРТ)Разработка систем связи*

В продолжение серии статей об интеграции Asterisk и VoiceNavigator опишу интеграцию VoiceNavigator с FreeSWITCH.

На Хабре имеется несколько статей и упоминаний об FS, но с популярностью Asterisk он не сравнится))

FreeSWITCH, являясь продолжением и развитием идей заложенных в Asterisk, имеет действительно модульную архитектуру, где весь основной функционал, на сколько это возможно, вынесен в отдельные модули. Это позволяет обеспечить большую гибкость создаваемых решений, масштабируемых от софтфона до софтсвича. FreeSWITCH может быть использован в качестве коммутатора, АТС, медиа-шлюза или медиа-сервера для приложений IVR, использующих XML-файлы для управления алгоритмом обработки звонка.

Для FreeSWITCH в отличие от Asterisk нет необходимости отдельно компилировать UniMRCP. Поддержка UniMRCP уже добавлена и работает «из коробки» в виде модуля asr_tts/mod_unimrcp.

Ниже описывается установка FreeSWITCH, подключение к нему VoiceNavigator и создание тестового голосового приложения.

Читать дальше →

mulai 28 сен 2011 в 13:23

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 4

7 мин

7.8K

Блог компании Центр речевых технологий (ЦРТ)Asterisk*Разработка систем связи*

Часть 1
Часть 2
Часть 3

В четвертой части, как и было обещано, рассмотрим ограничения и недостатки Asterisk как голосовой платформы и особенности его взаимодействия с VoiceNavigator.
Голосовая платформа – это программно-аппаратный комплекс с функциями синтеза и распознавания речи, позволяющий создавать решения, направленные на оптимизацию работы контакт-центра, усовершенствование работы с клиентами и построение систем голосового самообслуживания.

Asterisk голосовой платформой в чистом виде не является, т.к. работа с серверами синтеза и распознавания не является его основной задачей и реализуется посредством UniMRCP. Поэтому часть недостатков и ограничений связана именно с реализацией работы в UniMRCP.

Среди больших и известных голосовых платформ, использующихся в колл-центрах для построения СГС, стоит отметить Avaya Voice Portal, Genesys Voice Platform, Siemens OpenScape CCVP, Cisco Unified CCX, Voxeo, Voxpilot.
Информации в Рунете очень не много, как и специалистов по данным продуктам с соответствующим уровнем компетенции. Используются в больших колл-центрах, стоимость соответствующая, и доступна она только для больших компаний.
Если будет интерес к какой-то из платформ, готов написать о них отдельно.

Два основных недостатка, существующие в Asterisk+UniMRCP — это отсутствие поддержки VoiceXML и неработающий barge-in для синтеза речи.

Читать дальше →

mulai 3 авг 2011 в 14:51

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 3

13 мин

5.9K

Блог компании Центр речевых технологий (ЦРТ)Asterisk*Разработка систем связи*

Часть 1
Часть 2
Часть 4

В предыдущей статье было рассказано о тегах синтеза и о построении грамматик распознавания.
В этой части мне хотелось бы показать построение конкретного голосового приложения в Asterisk. Чтобы не придумывать голосовое меню для магазина «Рога и копыта», решил поступить проще и найти на Хабре ранее реализованный пример, на котором можно наглядно показать преимущества использования синтеза и распознавания.

На Хабре нашелся вот этот пост, который когда-то довольно активно обсуждался. Автор предлагает прослушивать прогноз погоды по телефону, используя множество предзаписанных файлов и xml-информеры с сайта Gismeteo. Мне хотелось бы усовершенствовать данное приложение и показать, как синтез и распознавание облегчают жизнь при построении IVR и получении динамической информации.

Приложение будет запрашивать город, погоду в котором хотелось бы узнать, затем спрашивать время (сегодня днем, завтра вечером и т.д.) и сообщать необходимую информацию.

Читать дальше →

+13

mulai 28 июл 2011 в 18:12

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 2

7 мин

8.4K

Блог компании Центр речевых технологий (ЦРТ)Asterisk*Разработка систем связи*

Часть 1
Часть 3
Часть 4

В предыдущей статье была описана общая схема работы, установлен UniMRCP, Asterisk подключен к VoiceNavigator и создано простое голосовое приложение.
Остановимся подробнее на возможностях синтеза и распознавания. Первая часть статьи будет посвящена языку разметки SSML, вторая — построению грамматик.

Использование языка разметки SSML

Управление синтезом речи на лингвистическом и акустическом уровне, происходит с помощью управляющих тегов в формате SSML.
С помощью тегов можно определить произношение, управлять интонацией, скоростью и громкостью звучания и т.д.
Опишу только наиболее используемые теги.
Подробную информацию по всем тегам можно получит в описании стандарта .

Читать дальше →

+20

mulai 26 июл 2011 в 13:50

Asterisk + UniMRCP + VoiceNavigator. Синтез и распознавание речи в Asterisk. Часть 1

9 мин

30K

Блог компании Центр речевых технологий (ЦРТ)Asterisk*Разработка систем связи*

Часть 2
Часть 3
Часть 4

Учитывая, возросший интерес сообщества к Asterisk решил внести и свою лепту и рассказать о построении голосовых меню с использованием синтеза и распознавания речи.

Статья рассчитана на специалистов, имеющих опыт работы с построением IVR в Asterisk и имеющих представление о системах голосового самообслуживания.

СГС (системы голосового самообслуживания) значительно расширяют возможности по созданию голосовых приложений и позволяют пользователю получать информацию и заказывать услуги самостоятельно, без участия оператора. Это может быть маршрутизация вызовов, запрос и выдача информации по расписанию авиарейсов, состояние банковского счета, заказ такси, запись на прием к врачу и пр.
Распознавание позволяет отказаться от линейных меню, создаваемых с помощью DTMF, разговаривать с системой человеческим языком и легко создавать меню с множественным выбором.
Синтез значительно упрощает работу с динамически меняющейся информацией и большими объемами текстовых данных.

Читать дальше →

+24