play_to Jun 5 2023 at 09:57

Пишем Telegram бота для распознавания голосовых сообщений и их обработки с помощью AI

Medium

7 min

13K

PHP *

From sandbox

Comments 12

kiff Jun 5 2023 at 17:38

Так как в премиум подписке ТГ есть функция аудио в текст, было бы неплохо сравнить данные подходы.

play_to Jun 5 2023 at 17:39

Так я же в статье как раз писал про это :)

Тем более, основная идея не просто в реализации speech-to-text, а в использовании нейронки для получения супер краткого пересказа голосового, без воды.

0x6b73ca Jun 6 2023 at 07:16

А можно пример json с ошибкой?

play_to Jun 6 2023 at 07:18

С ошибкой чего? О том, что сервис недоступен?)

GritsanY Jun 6 2023 at 05:03

Нужна платная подписка, чтобы через OpenAI API речь распознавать в аудио?

play_to Jun 6 2023 at 07:00

На старте, OpenAI, если я не ошибаюсь, даёт 18$ на тесты. Но карту нужно привязать, да. У них биллинг через stripe.

edvardpotter Jun 6 2023 at 07:01

А с оплатой OpenAI API проблем не было? Или оплачивать только через карточку зарубежного банка?

play_to Jun 6 2023 at 07:02

У них биллинг через Stripe, поэтому карты РФ и РБ не принимаются :(

NickyX3 Jun 6 2023 at 12:51

И наконец, последний аргумент в пользу whisper - цена. Он кратно дешевле.

Он вообще-то в опесорсе, ставите себе на сервер и никаких ограничений + умеет чисто на CPU, правда медленнее, чем с GPU.

play_to Jun 6 2023 at 13:35

Круто, не знал. Надо будет заняться вопросом на выходных)

NickyX3 Jun 6 2023 at 13:45

Более того, он и под Windows взлетает с полтычка даже на "полярисах", но в любом варианте требуется CPU не ниже intel core третьего поколения (там добавили FP16).

Плюсом достойные результаты зависят от модели, условно 500 мегабайтная делает ошибочки, 1500 Мб уже существенно лучше, но тут уж все зависит от размера доступной памяти как в системе, так и на GPU.

play_to Jun 6 2023 at 14:38

С другой стороны, пока стоимость использования whisper на мощностях от OpenAI не такая большая. И только если нагрузка на бот вырастет, тогда будет экономически целесообразно переходить.