Comments / Profile of DemiurgeSerge / Habr

Также мы даем бесплатный удаленный доступ к ASR и TTS по протоколу MRCP (телефония) сроком на 1 месяц.
Для этого достачно только сообщить нам ваш IP, что бы мы открыли доступ.
Этого вполне достаточно, что собрать что то и проверить как оно будет работать.

Look

Риски использования распознавания речи от Google в своих бизнес проектах

DemiurgeSerge Aug 6 2013 at 10:38

vnweb.speechpro.ru

Look

Риски использования распознавания речи от Google в своих бизнес проектах

DemiurgeSerge Aug 6 2013 at 10:31

Google хорошо распознает в телефонном канале и более сложные вещи, но в статье я хотел написать не про это.
А про то, что при реализации промышленного решения, качество распознавания занимает лишь 15-20% головной боли.
А все остальное — это документооборот, ТЗ, созданию IVR-меню, внедрение, интеграция, тестирование, отладка, еще тестирование и т.д.
И Google здесь внесет свой отпечаток риска в каждый пункт.

Look

Риски использования распознавания речи от Google в своих бизнес проектах

DemiurgeSerge Aug 6 2013 at 09:49

отвечу в ЛК, сюда считаю некрасивым писать цены

Look

Самообслуживание клиентов с помощью google ASR

DemiurgeSerge Aug 6 2013 at 09:10

Написал ответную статью на ваш пост

Look

Речевые технологии. Распознавание слитной речи для чайников на примере IVR систем

DemiurgeSerge Jun 28 2013 at 05:42

Нет. ПО лицензируется по количеству каналов (сессий) и ему все ровно кто и от куда к нему обращается. Оно умеет только синтезировать и распознавать и подключается напрямую к IVR платформе. А уж чем занимается эта IVR платформа, VoiceNavigator не интересует.
Например VN стоит у оператора связи Телфин и обслуживает одновременно 20-30 компаний.

Look

Речевые технологии. Распознавание слитной речи для чайников на примере IVR систем

DemiurgeSerge Jun 27 2013 at 13:06

Как мне подсказали коллеги, синтезированный голос на ст. м. Фрунзенская (здесь находится наш офис) просит не оставлять вещи на пероне и т.д. Также вспомнил сообщение в вагоне, что на какой то см. метро (не Девяткино) не открывается последняя/первая дверь.

У нас есть приложения на iOS, которое читает книги синтезом, «Читатель» называется, есть RSS ридер, который новости читает синтезом.
В сторону Android смотрим, но без особого рвения, т.к. монетизация там сильно ниже.
Но понимаем, что рано или поздно это случится.

У нас есть сейчас доступ к синтезу через веб, по http. Это в какой то мере закрывает потребности в озвучивании сайтов, мобильных приложений, корпоративных справочных систем. Могу дать тестовый доступ.

Версии под Windows не планируются по политическим и финансовым причинам. Стоить оно много не может, а возможности предоставит огромные.

Look

Речевые технологии. Распознавание слитной речи для чайников на примере IVR систем

DemiurgeSerge Jun 27 2013 at 11:18

Когда едешь в вагоне по синей ветке, он произносит какие то служебные сообщения, которые актуальны только иногда.
Пору раз слышал на пероне какие то предупреждения — не могу точно вспомнить текст.
Но синтез они используют 100% (ЦРТ, голос Владимир) — сами продавали им.

Дело в том, что внутренняя маршрутизация телефонных вызовов в Питерском Метро работает на основе распознавания речи, т.к. у них в телефонной инфраструктуре очень много телефонов без DTMF, а иногда и вообще без цифровых кнопок.
т.к. речевые технологии уже используются, то почему бы и сообщения не озвучивать синтезом на скорую руку…

Look

Речевые технологии. Распознавание слитной речи для чайников на примере IVR систем

DemiurgeSerge Jun 27 2013 at 08:27

В этой статье я не планировал писать о самом ПО VoiceNavigator.
У нас есть вся документация: по установке, настройке, отладке. Есть доки по интеграции с каждой голосовой платформой.
Стоимость я тоже не буду писать — не похвалят за рекламу.
Если нужно больше информации, то www.vxml.ru — там, кстати, вся документация выложена.

Look

Речевые технологии. Распознавание слитной речи для чайников на примере IVR систем

DemiurgeSerge Jun 27 2013 at 07:48

Сорри, не сразу сообразил, что тег ката ставится только в конце текста.

Look

Технология «рисованного звука»: cинтез звука в СССР 30-х годов XX века

DemiurgeSerge Jun 10 2013 at 14:02

кстати, ходили слухи, что разработчикам технологии удалось синтезировать голос Ленина

ЦРТ давно уже имеет техническую возможность воссоздавать голоса людей из прошлого.
Ссылка на ролик

Look

1 2