Как стать автором
Обновить
14
0
Сергей Исаев @DemiurgeSerge

CEO в DataFabric (Semantic web)

Отправить сообщение
Вы думаете решения ЦРТ не документированы? Вместе с VoiceNavigator'ом идет пакет из 19 документов — часть из них я сам писал, когда работал в ЦРТ. Это полностью коммерческое и промышленное решение.
Что значит доступно? Можно купить или мало денег стоит? Кто хочет купить систему распознавания речи — тот покупает, это никогда не было проблемой.
Если Вы называете такие компании как Google и Яндекс, то почему забыли Nuance — мирового гиганта?
Российские компании тоже есть, не смог их сейчас загуглить за минуту, но еще 2-3 точно есть, я с ними общался, но названия из головы вылетели.
Первые три строчки статьи вызывают недоумение. А как же распознавание речи от ЦРТ (Центр речевых технологий)? А есть еще и другие компании… тоже Российские.
Сорри за оффтоп, но…
Личность Шелдона максимально органична для рекламы Intel — отличный ход.
Только сейчас заметил его аватар в твите. Какой тонкий юмор от Элона…
Добрый день. Ваше устройство хоть и отвечает минимальным требованиям по мощности, но находится «на грани».
Знаю и более слабые устройства на которых все играет, но это скорее исключение.
В следующих версиях постараемся еще снизить требования к ресурсам устройства.
Да, можно будет использовать как дефолтный. По срокам не скажу, еще обсуждаем.
Что у Вас за устройство?
Вы можете послушать, как звучит голос прямо в приложении, нажав на изображение «динамика» слева от названия голоса.
Идея забавная, и имеет право на жизнь, но требует дополнительной подготовки текста.
У нас внутри компании мы иногда разыгрывали «сценки» разными голосами, просто так…
А на самом деле — ставить на «паузу» во время входящего вызова и т.д.
И вот когда прошла неделя выясняется, что его оказывается не уволили, а повысили.
Можно. Это делается с помощью SSML разметки или с применением специальных символов. Насколько я помню, для указания места ударения нужно поставить спецсимвол "*" в теле слова.
Да, это один из наших первых крупных проектов. Там стоит распознавание слитной речи. Можно в одном предложении сказать куда хотите поехать, откуда и когда и она вам зачитает список поездов и свободные места в них. Подробнее здесь.
Мы пользуемся внутри ЦРТ Барышней уже 4 года.
Могу сказать, что мы ее долго «пилили», что бы ей было действительно удобно пользоваться в реальной жизни.
Например, при ошибках распознавания мы ранее говорили об этом абоненту и предлагали повторить запрос, на это уходило 3-5 сек. Когда ты пользуешься системой каждый день по 50 раз, то знаешь наизусть все фразы и они сильно раздражают. Поэтому у нас сейчас вместо многих сообщений просто короткие но разные звуковые «бибигалки».
В результате у нас 2 версии системы: для внешнего мира и неподготовленного пользователя и для внутреннего пользования с максимально быстрым взаимодействием, без всяких «бла-бла». В этом случае она реально удобнее и быстрее DTMF.
Подобная система.
Тоже на Asterisk сделана.
Ошибка 403 означает, что в поле «демо» было введено больше 150 символов.

В последствии дизайн VoiceFabric заметно обновится, сейчас он сделан больше из шаблонных элементов. В это время и вывод ошибки будет «человеческий». В приоритете у нас развитие функциональности. Постоянно придумываем что-то новое, из-за чего приходилось вносить правки в дизайн.
Например, мы хотим на главную страницу вывести анимированные губы, что бы сразу показать в работе технологию Lipsync — это бы заставило нас дорабатывать дизайн.
Вы про распознавание речи? Не очень понял вопрос.
Технологии синтеза и распознавания речи являются языкозависимыми, они напрямую зависят от региона, где распространяется технология, поэтому хорошие примеры голосов/языков нельзя проецировать на остальные языковые рынки. Это не тоже самое, что локализовать интерфейс какого либо ПО. Поэтому количественные показатели языков на каждом конкретном рынке большой роли не играют.

Есть мультиязычные страны, где одновременно, например, может быть востребован английский и французский язык.
Но в России на практике такого нет, здесь мультиязычность второстепенна.

В тоже время, например, в Казахстане ситуация другая, в связи с тем, что в ходу одновременно несколько языков.
Для них критично, что бы на ряду с казахским языком был еще и русский.

Что по поводу звуковых форматов, то это технический быстро решаемый момент, который не является камнем преткновения.
Специально для этого мы на главной странице сделали демо-режим, что бы каждый мог все протестировать и самостоятельно сделать для себя выводы, какое у кого качество и кому и за что платить.
VoiceFabric ориентирован в том числе и на работу с частными пользователями. Если начать процесс регистрации на портале, то Вы увидите, что можно зарегистрироваться как физическое и юридическое лицо. Сейчас 90% всех регистраций на портале — это как раз частные лица. Так что выбор за Вами.

Информация

В рейтинге
Не участвует
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Дата рождения
Зарегистрирован
Активность