Comments / Profile of morfeusys / Habr

Дмитрий Че @morfeusys

Программист

ProfileArticles9PostsNewsComments146

SpeechMarkup API — превращаем речь в данные

morfeusys Nov 11 2014 at 06:14

Так в статье же я указал, что в скором времени пользователи смогут добавлять свои сущности и логику

SpeechMarkup API — превращаем речь в данные

morfeusys Nov 11 2014 at 06:14

Всегда бесплатно

SpeechMarkup API — превращаем речь в данные

morfeusys Nov 10 2014 at 21:03

База Geonames содержит очень необычные города порой )) Уже почистили, спасибо.
Лимитов нет никаких.

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Oct 8 2014 at 14:25

Ну это только вы )) и сколько же у них ограничения? )) вообще-то под андроидом ограничения нет, но все же — слушать постоянно голос в облаке… это как-то что-то странно… И гугл будет очень недоволен, если это будет делать еще хотя бы пара тысяч человек…

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Oct 8 2014 at 11:07

Шум не любит не покетсфинкс, а я конкретная аккустическая модель. Если натренеровать свою — будет работать и в шуме.
Если постоянно слушать эфир… Ну что тут сказать — трафик плюс гугл в конечном итоге откажет вашему приложению в обслуживании, как только вашей системой начнете пользоваться не только вы…

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Oct 8 2014 at 10:32

Первая проблема — не проблема. Решается за счет правильно написанной грамматики (garbage) и фильтрации результат по score, который можно легко посчитать. Это обычная практика для распознавания на базе контекстно-свободной грамматики.
Второе — «в разы понижает удобство»??? Я как-то не заметил этого «в разы». А вы гуглом все время слушаете эфир на предмет команды?? Ого… Гугл вас забанит или весь трафик съест )) Плюс гугл любит становиться «недоступным» — это все же облачный сервис…
Третье — еще все зависит от микрофона. Вы говорите что гугл распознает с нескольких метров?? Не поверю. Гугл распознавание рассчитано на небольшое расстояние. А в шуме вы от него вообще не добьетесь результата на расстоянии метра.

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Oct 7 2014 at 08:00

Что конкретно? интересно — давайте пообщаемся

Управление домашними электроприборами («умный дом») через чат бот на Raspberry Pi

morfeusys Oct 7 2014 at 07:06

Статья классная! Но ребят, то о чем вы рассказываете — далеко не обработка естественного языка…
Гораздо интереснее варианты типа «выключи весь свет и кондиционеры в комнатах когда я уйду из дома» или «уменьши яркость всего освещения кроме настольный лампы», «а теперь сделай побольше». Притом что умный дом — это далеко не только розетки…
Для задач типа вашей — вот например уже с голосовым управлением сразу http://habrahabr.ru/post/237589/
Для задач с естественным языком — есть множество гораздо более гибких подходов с извлечением смысла из фразы и поддержанием контекста и диалога. И причем с открытым API типа http://habrahabr.ru/company/ifree/blog/202132/
Если будет интересно — давайте пообщаемся. Мы занимаемся той же темой.

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 27 2014 at 16:27

Простите, а зачем логика должна быть где-то?? Кокретно в данном приложении логика на клиенте и этого хватает для решения конкретной задачи…

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 26 2014 at 10:45

Тогда, возвращаясь к вашей реплике

На мой згляд, было бы здорово добавить универсализма, например отправлять результаты через mqtt.

Какие результаты вы бы предложили отправлять через mqtt???

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 26 2014 at 05:15

Еще раз отвечу вам — openhab. Он интегрирован и с mqtt тоже. Openhab интегрируется с сотней систем, а не с десятком.

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 25 2014 at 11:03

Вот вам how to от того же автора

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 25 2014 at 10:41

Максимальный универсализм с помощью голосового ассистента и севрера openhab

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 24 2014 at 12:08

Да, действительно. Я-то уж давно прикрутил ее к моей Дусе ;-)
и в умный дом еще

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 23 2014 at 05:03

Есть еще по тапу на виджет. Или с бт гарнитуры. Или из шторки — быстрый старт. У Дуси активаций масса. Читайте внимательнее.
Если у вас разблокируется при графическом ключе — то это уже проблемы вашей прошивки.

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 22 2014 at 20:08

Уязвимости? Ээ… Так поставьте графический ключик. Хотя Если ваш телефон в руки взял злоумышленник — то пенять тут на ассистента без толку, ваши данные и без него станут доступны.
Кстати все виды активации можно вообще выключить. Так что об «уязвимостях» тут говорить неуместно.

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 22 2014 at 15:45

Ну теоретически можно. Но на какой движок и зачем вы будете это отправлять? Тем более если вы что-то сказали, то pocketsphinx все равно вернет вам какую-то гипотезу по грамматике.

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 22 2014 at 14:43

Это вещи на стыке разных технологий. Задача процессинга текста по сути никак не связана с распознаванием. Также как и распознавание с процессингом. Но при реализации в единой парадигме можно решать обе задачи более эффективно.

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 22 2014 at 11:14

Угу, при том что Дуся обязательно при этом переспросит голосом владельца, прежде чем что-то отправлять ))

Сверхбыстрое распознавание речи без серверов на реальном примере

morfeusys Sep 22 2014 at 07:40

Грамматики тут не принимают участия. Если вы про активацию голосом. В активации голосом нужно подбирать подходящее значение порога.
Плюс еще важно, что активационная фраза не должна быть короткой. Примерно 2 слова по 2-3 слога в каждом. Необходимо также очень аккуратно писать транскрипции.

1 2 3

5 6 7 8