Amvera_Speech 9 фев 2023 в 13:12

Предоставляем бесплатное облачное распознавание речи ASR

Простой

2 мин

2.9K

Блог компании AmveraOpen source*Семантика*Машинное обучение*Голосовые интерфейсы*

В этой статье мы, команда Amvera Speech, расскажем, как сделали первое действительно бесплатное облачное распознавание речи и как им воспользоваться.

Разработчики систем распознавания речи, как правило, используют поминутную тарификацию распознавания. В одной из прошлых статей я уточнял, почему считаю это далеко не всегда правильным (если кратко, то при такой тарификации вендоры округляют длительность в большую сторону, а значит, за распознавание коротких записей вы заметно переплачиваете, а при большом трафике это просто очень дорого).

Давайте теперь разберемся, действительно ли для вендоров экономически оправданно брать деньги с хобби-проектов и небольших компаний, которым нужно распознавать не миллионы, а всего лишь десятки или сотни минут в день.

По грубым оценкам нашей компании (Amvera Speech – разработчик собственной системы распознавания) в России за год появляется около 200-300 хобби-проектов и стартапов, которым нужно распознавать от 10 до 300 минут речи в день. При этом среднее значение составляет буквально 50 минут. Часть этих проектов используют open-source сервисы. Но ASR open-source решения для русской спонтанной речи, особенно зашумленной, часто дают крайне низкое качество.

Весь рынок облачного распознавания для хобби-проектов и стартапов составляет чуть более 5 млн. минут речи или, по расценкам облачного распознавания Яндекса, – чуть более 3 млн. руб. Иными словами, этого рынка просто нет. Однако такие компании, как Яндекс, ЦРТ, Тинькофф (есть, правда, и пара компаний-исключений, например, VK, с совсем небольшими бесплатными лимитами и возможность использовать небольшие стартовые кредиты) просят платить "с первой минуты" распознавания. Серверные мощности на таких объемах почти ничего не стоят, однако крупные вендоры все равно берут деньги с микро-бизнеса и хобби-проектов.

Мы решили исправить ситуацию и сделать распознавание речи Amvera Speech для хобби-проектов и стартапов бесплатным!

Так как наша цель - сделать распознавание бесплатным именно для хобби-проектов, а не для банков и операторов связи, то есть и несколько ограничений.

Сейчас доступно 10 потоков (vCPU) на всех. Это примерно 500 000 бесплатных минут в месяц. При высокой загрузке будет действовать лимит, где бесплатно можно распознавать до 300 минут в день и до 5000 минут в месяц на пользователя.

На инициативу мы выделили не самый мощный сервер. Поэтому, возможно, придется подождать, пока очередь дойдет до ваших файлов, если много пользователей одновременно грузят аудиодорожки.

Теперь, если вам нужно распознавать речь, вы можете воспользоваться облаком Amvera Speech бесплатно следующим образом.

Воспользоваться доступом и документацией и API по ссылке.
Отправить аудиозаписи и дождаться ответа по WebHook c распознанным текстом.
Чуть позже мы сделаем функционал получения персональных токенов через нашего телеграм-бота.
Если совсем не приходит ответ, что-то сломалось или есть вопросы, пишите мне на почту kkosolapov@amvera.ru (Кирилл Косолапов).

А быстро протестировать качество распознавания речи Amvera Speech можно, отправив голосовое сообщение или короткий аудиофайл (до пары минут) нашему телеграм-боту@AmVeraSpeechBot.

Теги:

Хабы:

Предоставляем бесплатное облачное распознавание речи ASR

Публикации

Информация