Someonesolitude18 дек 2011 в 18:43

Распознавание и синтез речи в любое приложение под iOS за час

12 мин

12K

iOS *

+37

Комментарии 18

seonik 19 дек 2011 в 00:17

Полезная статья. Есть пара вопросов:
— Как долго нужно ждать синтезированную речь? Вы уже экспериментировали?
— Распознает только английскую речь?

MYPABEU 19 дек 2011 в 05:12

Dragon Dictation вполне неплохо и русскую распознает.

Someonesolitude 19 дек 2011 в 07:42

привет. 1). синтезированная речь — дело нескольких секунд (в зависимости от длины текста). сам не экспериментировал с этим, могу точно сказать, что в пределах 8 секунд

2). все сервисы поддерживают русский язык и еще кучу других помимо английского

int03e 19 дек 2011 в 06:22

Спасибо за статью! А как распознавание по сравнению с сири?

Someonesolitude 19 дек 2011 в 07:43

по качеству распознавание от Nuance и Siri абсолютно идентичны

maxmert 19 дек 2011 в 07:03

Ставил Dragon на iPhone. Распознавал ужасно (особенно когда технический текст). Предполагаю, что SDK использует те же библиотеки. Но так как отсутствуют альтернативы, то на данный момент это, видимо, лучшее приложение, распознающее русскую речь. Кстати, удалил через 20 минут – набирать оказалось быстрее.

Someonesolitude 19 дек 2011 в 07:46

вообще тут дело вот в чем (знаком с этим приложением) — когда вы пытаетесь диктовать технический текст, то не задумываетесь, есть ли в языковых базах то или иное слово. Dictation задумывался как диктовка чисто бытовая, а технические и любые нужные словари можно заказывать на этот app опционально (правда не совсем представляю, как). можт с этим и низкий процент распознавания связан

SAKrisT 19 дек 2011 в 10:37

поставил, русский еще кое как у меня распознает, а с англ хреново…

Pilot34 19 дек 2011 в 07:05

Я правильно понимаю, что это как и Siri все через сервер работает, да?

И в ту и в другую сторону? А edge хватает для работы?

Someonesolitude 19 дек 2011 в 07:47

стандартного моб.интернета хватает, ага. работает через сервер

Omega 19 дек 2011 в 09:40

а как дело обстоит с детскими голосами? реально, если применять для распознаваня в детских обучающих приложениях?

brainplus 19 дек 2011 в 11:07

ссылка на faq битая.

brainplus 19 дек 2011 в 11:12

Все-таки это убожество — все через сеть гонять.

Вот у нашей Питерской фирмы Speereo.com движок синтеза и распознавания речи не требует инета. Они единственные с оффлайновым синтезом и распознаванием — всякие гуглы, эплы и прочая обломались что-то сделать, работающее оффлайн.

Ну и у speereo.com есть и облачные решения тоже (когда голос облаком распонзается и синтезируется) — о них они писали на хабре.

Someonesolitude 19 дек 2011 в 11:42

честь и хвала такому оффлайновому чудо-движку, и успехов вашему начинанию

TataLee 19 дек 2011 в 16:26

Если офлайновый синтез ставить в мобильное приложение, сколько оно весить будет? Из этого действительно можно сделать что-то удобоваримое для мобильной операционки, не особо загружая память? Есть примеры интеграции?

brainplus 19 дек 2011 в 17:36

я немного не правильно выразился — я там не работаю, «наша фирма» = «российская фирма».

Примеры интеграции на сайте. В частности всякие голосвые переводчики под симбиан. Про базы для распознавания — вроде там написано.

Я бы лично готов таскать 1ГБ данных на айфоне, чем в международном роуминге платить $10 за мегабайт мобильного инета (ведь сколько там передача голоса жрет трафика — хз).

sgzmd 19 дек 2011 в 17:33

Подождите, я не понял… то есть Apple не предоставляет готовых интерфейсов голосового ввода/вывода что ли?!

Someonesolitude 19 дек 2011 в 18:04

нет, предоставляются (не Эпплом а Ньюансом) компоненты клиента и сервера (весят несколько сотен килобайт), которые встраиваются в код приложения, а сервисы сами по себе онлайновые, т.е. запрос на обработку речи в текст или текста в речь по-любэ уходит на сервера и оттуда возвращается юзеру в нужном виде. занимает несколько секунд в зависимости от веса и скорости инета.
разработчику, подключившемуся к сотрудничеству «Silver» это ничего, кроме некоторого времени на внедрение, стоить не будет

Зарегистрируйтесь на Хабре, чтобы оставить комментарий