Также мы даем бесплатный удаленный доступ к ASR и TTS по протоколу MRCP (телефония) сроком на 1 месяц.
Для этого достачно только сообщить нам ваш IP, что бы мы открыли доступ.
Этого вполне достаточно, что собрать что то и проверить как оно будет работать.
Google хорошо распознает в телефонном канале и более сложные вещи, но в статье я хотел написать не про это.
А про то, что при реализации промышленного решения, качество распознавания занимает лишь 15-20% головной боли.
А все остальное — это документооборот, ТЗ, созданию IVR-меню, внедрение, интеграция, тестирование, отладка, еще тестирование и т.д.
И Google здесь внесет свой отпечаток риска в каждый пункт.
Нет. ПО лицензируется по количеству каналов (сессий) и ему все ровно кто и от куда к нему обращается. Оно умеет только синтезировать и распознавать и подключается напрямую к IVR платформе. А уж чем занимается эта IVR платформа, VoiceNavigator не интересует.
Например VN стоит у оператора связи Телфин и обслуживает одновременно 20-30 компаний.
Как мне подсказали коллеги, синтезированный голос на ст. м. Фрунзенская (здесь находится наш офис) просит не оставлять вещи на пероне и т.д. Также вспомнил сообщение в вагоне, что на какой то см. метро (не Девяткино) не открывается последняя/первая дверь.
У нас есть приложения на iOS, которое читает книги синтезом, «Читатель» называется, есть RSS ридер, который новости читает синтезом.
В сторону Android смотрим, но без особого рвения, т.к. монетизация там сильно ниже.
Но понимаем, что рано или поздно это случится.
У нас есть сейчас доступ к синтезу через веб, по http. Это в какой то мере закрывает потребности в озвучивании сайтов, мобильных приложений, корпоративных справочных систем. Могу дать тестовый доступ.
Версии под Windows не планируются по политическим и финансовым причинам. Стоить оно много не может, а возможности предоставит огромные.
Когда едешь в вагоне по синей ветке, он произносит какие то служебные сообщения, которые актуальны только иногда.
Пору раз слышал на пероне какие то предупреждения — не могу точно вспомнить текст.
Но синтез они используют 100% (ЦРТ, голос Владимир) — сами продавали им.
Дело в том, что внутренняя маршрутизация телефонных вызовов в Питерском Метро работает на основе распознавания речи, т.к. у них в телефонной инфраструктуре очень много телефонов без DTMF, а иногда и вообще без цифровых кнопок.
т.к. речевые технологии уже используются, то почему бы и сообщения не озвучивать синтезом на скорую руку…
В этой статье я не планировал писать о самом ПО VoiceNavigator.
У нас есть вся документация: по установке, настройке, отладке. Есть доки по интеграции с каждой голосовой платформой.
Стоимость я тоже не буду писать — не похвалят за рекламу.
Если нужно больше информации, то www.vxml.ru — там, кстати, вся документация выложена.
Для этого достачно только сообщить нам ваш IP, что бы мы открыли доступ.
Этого вполне достаточно, что собрать что то и проверить как оно будет работать.
А про то, что при реализации промышленного решения, качество распознавания занимает лишь 15-20% головной боли.
А все остальное — это документооборот, ТЗ, созданию IVR-меню, внедрение, интеграция, тестирование, отладка, еще тестирование и т.д.
И Google здесь внесет свой отпечаток риска в каждый пункт.
Например VN стоит у оператора связи Телфин и обслуживает одновременно 20-30 компаний.
У нас есть приложения на iOS, которое читает книги синтезом, «Читатель» называется, есть RSS ридер, который новости читает синтезом.
В сторону Android смотрим, но без особого рвения, т.к. монетизация там сильно ниже.
Но понимаем, что рано или поздно это случится.
У нас есть сейчас доступ к синтезу через веб, по http. Это в какой то мере закрывает потребности в озвучивании сайтов, мобильных приложений, корпоративных справочных систем. Могу дать тестовый доступ.
Версии под Windows не планируются по политическим и финансовым причинам. Стоить оно много не может, а возможности предоставит огромные.
Пору раз слышал на пероне какие то предупреждения — не могу точно вспомнить текст.
Но синтез они используют 100% (ЦРТ, голос Владимир) — сами продавали им.
Дело в том, что внутренняя маршрутизация телефонных вызовов в Питерском Метро работает на основе распознавания речи, т.к. у них в телефонной инфраструктуре очень много телефонов без DTMF, а иногда и вообще без цифровых кнопок.
т.к. речевые технологии уже используются, то почему бы и сообщения не озвучивать синтезом на скорую руку…
У нас есть вся документация: по установке, настройке, отладке. Есть доки по интеграции с каждой голосовой платформой.
Стоимость я тоже не буду писать — не похвалят за рекламу.
Если нужно больше информации, то www.vxml.ru — там, кстати, вся документация выложена.
ЦРТ давно уже имеет техническую возможность воссоздавать голоса людей из прошлого.
Ссылка на ролик