Pull to refresh
14
0
Сергей Исаев @DemiurgeSerge

CEO в DataFabric (Semantic web)

Send message
Сейчас мы делаем новый сайт посвященный речевым технологиям, там она будет на первом месте.
это веб-служба, но ПО, которое распознает (VoiceNavigator Web) оно работает под виндой и его можно установить себе локально, при реализации проекта.
Также мы даем бесплатный удаленный доступ к ASR и TTS по протоколу MRCP (телефония) сроком на 1 месяц.
Для этого достачно только сообщить нам ваш IP, что бы мы открыли доступ.
Этого вполне достаточно, что собрать что то и проверить как оно будет работать.
Google хорошо распознает в телефонном канале и более сложные вещи, но в статье я хотел написать не про это.
А про то, что при реализации промышленного решения, качество распознавания занимает лишь 15-20% головной боли.
А все остальное — это документооборот, ТЗ, созданию IVR-меню, внедрение, интеграция, тестирование, отладка, еще тестирование и т.д.
И Google здесь внесет свой отпечаток риска в каждый пункт.
отвечу в ЛК, сюда считаю некрасивым писать цены
Нет. ПО лицензируется по количеству каналов (сессий) и ему все ровно кто и от куда к нему обращается. Оно умеет только синтезировать и распознавать и подключается напрямую к IVR платформе. А уж чем занимается эта IVR платформа, VoiceNavigator не интересует.
Например VN стоит у оператора связи Телфин и обслуживает одновременно 20-30 компаний.
Как мне подсказали коллеги, синтезированный голос на ст. м. Фрунзенская (здесь находится наш офис) просит не оставлять вещи на пероне и т.д. Также вспомнил сообщение в вагоне, что на какой то см. метро (не Девяткино) не открывается последняя/первая дверь.

У нас есть приложения на iOS, которое читает книги синтезом, «Читатель» называется, есть RSS ридер, который новости читает синтезом.
В сторону Android смотрим, но без особого рвения, т.к. монетизация там сильно ниже.
Но понимаем, что рано или поздно это случится.

У нас есть сейчас доступ к синтезу через веб, по http. Это в какой то мере закрывает потребности в озвучивании сайтов, мобильных приложений, корпоративных справочных систем. Могу дать тестовый доступ.

Версии под Windows не планируются по политическим и финансовым причинам. Стоить оно много не может, а возможности предоставит огромные.
Когда едешь в вагоне по синей ветке, он произносит какие то служебные сообщения, которые актуальны только иногда.
Пору раз слышал на пероне какие то предупреждения — не могу точно вспомнить текст.
Но синтез они используют 100% (ЦРТ, голос Владимир) — сами продавали им.

Дело в том, что внутренняя маршрутизация телефонных вызовов в Питерском Метро работает на основе распознавания речи, т.к. у них в телефонной инфраструктуре очень много телефонов без DTMF, а иногда и вообще без цифровых кнопок.
т.к. речевые технологии уже используются, то почему бы и сообщения не озвучивать синтезом на скорую руку…
В этой статье я не планировал писать о самом ПО VoiceNavigator.
У нас есть вся документация: по установке, настройке, отладке. Есть доки по интеграции с каждой голосовой платформой.
Стоимость я тоже не буду писать — не похвалят за рекламу.
Если нужно больше информации, то www.vxml.ru — там, кстати, вся документация выложена.
Сорри, не сразу сообразил, что тег ката ставится только в конце текста.
кстати, ходили слухи, что разработчикам технологии удалось синтезировать голос Ленина


ЦРТ давно уже имеет техническую возможность воссоздавать голоса людей из прошлого.
Ссылка на ролик

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity