Комментарии 9
декодированный аудиопоток в формате JSON
Простите, что? Я всё правильно понял — вы заворачиваете бинарные данные в JSON, неважно каким способом? Что мешает посылать напрямую бинарные данные? Зачем так жёстко греть процессор?
+1
Работать с текстовыми данными проще + их поддерживает большее количество серверных библиотек. К тому же Base64 обычно либо реализован железно, либо неплохо оптимизирован на SIMD-инструкциях.
Ну и да, таким образом мы можем слать несколько аудиоканалов (например, по одному каналу от каждого из участников) в одном потоке, вместо того чтобы использовать бинарный протокол, от которого веб-разработчики часто не в восторге.
Ну и да, таким образом мы можем слать несколько аудиоканалов (например, по одному каналу от каждого из участников) в одном потоке, вместо того чтобы использовать бинарный протокол, от которого веб-разработчики часто не в восторге.
+1
Может оффтопик конечно: С Google Speech To Text API есть нюанс, нельзя просто создать recognizeStream и долго долго слать туда аудио поток — через минуту все сломается, т.к. API имеет лимиты на максимальную длительность аудио потока, как раз в эту самую минуту (несмотря на то что в документации указан лимит в 5 минут, я получал ошибку через 1 минуту, уж не знаю почему так). В связи с чем приходится сильно усложнять логику работы с API, а именно буферизировать аудио пакеты и отслеживать какие из них уже были распознаны, а какие нет. Лично у меня только раза с 3-го получилась рабочая версия, действительно умеющая работать с бесконечным аудио потоком.
+2
У меня два вопроса
Зачем все так сложно?
Почему в twilio все так просто?
Зачем все так сложно?
Почему в twilio все так просто?
0
Действительно ли в Twilio все так просто: www.twilio.com/blog/live-transcribing-phone-calls-using-twilio-media-streams-and-google-speech-text ?)
А вообще, если хотите проще, попробуйте модуль ASR. Об этом есть пометка в начале статьи.
А вообще, если хотите проще, попробуйте модуль ASR. Об этом есть пометка в начале статьи.
+1
deleted
0
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.
Бэрримор, что за шум вокруг Voximplant? Внедрили веб-сокеты, сэр