CodeName33 Apr 8 2024 at 06:10

Распознаем голосовые сообщения Telegram без СМС и пересылок ботам

7 min

18K

Instant Messaging * C# * GitHub *

Tutorial

+36

Comments 31

13werwolf13 Apr 8 2024 at 06:21

давно посещала мысль взять родной клиент телеги и немного пофикить его, чтобы заветная кнопка транслита появлялась не только с премом а сообщения на разшифровку улетали не туда куда их телега шлёт а куда нибудь куда я хочу. но лень оказалась сильнее.

Spyman Apr 9 2024 at 14:40

Не только вас, есть клиент iMe для андроид который голосовые до минуты длинной расшифровывает без премиума с удивительным качеством. Правда он странно определяет продолжительность - иногда можно и полторы минуты расшифровать, а иногда и 35 секунд не даёт.

Orion33 Oct 8 2025 at 10:37

а также который проявляет какую-то странную активность и из-за которого прилетает бан на сутки после одного поста в публичной группе с предложением оплатить премиум для сокращения срока.

gudvinr Apr 8 2024 at 06:32

Для начала нам нужно получить ключи разработчика телеграм, это легко: https://core.telegram.org/api/obtaining_api_id

Легко-то легко, но:

Due to excessive abuse of the Telegram API, all accounts that sign up or log in using unofficial Telegram API clients are automatically put under observation to avoid violations of the Terms of Service.

CodeName33 Apr 8 2024 at 06:50

Нужно просто не нарушать Terms of Service, и в данном случае, я не вижу нарушений у моего приложения. Без ведома пользователя оно ничего не отправляет, статусы не подделывает, исчезающие сообщения не хранит.

vvbob Apr 8 2024 at 06:35

здесь я расскажу, как я попробовал решить для себя эту проблему

Я обычно, либо просто игнорю эти сообщения, либо, если это невозможно (шеф, к примеру отправил, хотя у меня такого еще не бывало, это гипотетически) всячески откладываю его прослушивание. Это мотивирует таких любителей поговорить использовать текст в чатах, если им нужна оперативность. Ну а если что-то прямо горит капец как - есть, блин, телефон!

И вот удивительно.. как-то на одном из прошлых проектов один коллега сильно любил эти голосовые сообщения и фигачил их в рабочий чат без остановки, я вообще ни одного не прослушал, и ничего не потерял от этого.

McKinseyBA Apr 8 2024 at 09:06

кто-то в ответ на голосовые начинает отправлять видео, как он на бумаге пишет ответ, или как он набирает его в ворде

интересный вариант, надо попробовать)

JustasZT Apr 9 2024 at 10:17

Когда некоторые любители голосовых не понимают, что слушать их опусы, как правило, срочные, у меня нет возможности, сообщаю об этом. Если понимания не возникает, второе сообщение могу вовсе проигнорировать до появления подходящих обстоятельств прослушивания. Если голосовые продолжают сыпаться (почему-то это происходит в перемешку с текстовыми о срочности), дублирую первое сообщение переведенное в qr-код. Картинкой. Не только лишь все догадываются, что такое сообщение можно прочитать, приложив примерно те же усилия, что с переводом голосового в текст, но моя совесть после этого абсолютно чиста.

0x6b73ca Apr 8 2024 at 10:05

Жду когда телега позволит запрещать голосовые в личных чатах

CodeName33 Apr 8 2024 at 10:23

Она позволяет. Тем кто покупает Premium)

SUNsung Apr 8 2024 at 18:58

Но даже премиум не запрещает и не блркирует сторисы((

CodeName33 Apr 8 2024 at 19:42

Все сторизы вроде нельзя, но если подержать палец на конкретном сторизе, то можно срыть сторизы этого человека и так медленно и методично скрывать их все)

MaFrance351 Apr 9 2024 at 09:55

Служебные от Telegram иногда всплывают, их скрыть нельзя.

rise3515 Apr 9 2024 at 13:20

Поставьте клиент, который позволяет. Это по сути базовая функция любого клиента

dryja Apr 10 2024 at 06:07

Альтернативные клиенты в помощь. На Винде есть 64gram, на ведре TurboTel (а также несколько других), на огрызке NiceGram, например. И строим можно отключить, плюс ещё несколько полезных свистоперделок: например, показ айди юзера или группы в профиле (удобно для разработки и дебага).

DarkCoder15 Apr 8 2024 at 18:11

Она позволяет, но я делал бота, который просто удаляет в ЛС голосовые)

maslakak Apr 8 2024 at 10:22

В случае, если голосовые данные обрабатываются или хранятся на серверах мессенджера или сторонних сервисов, это может вызывать опасения по поводу их защиты и возможности несанкционированного доступа к ним. В целом это интересное технологическое достижение, но его реализация должна учитывать важные аспекты безопасности, конфиденциальности и соблюдения законодательства.

censor2005 Apr 8 2024 at 11:02

Bot message detected

Gryphon88 Apr 8 2024 at 12:37

А совсем-совсем локально, прям на телефоне, где установлен мессенджер? termux?

CodeName33 Apr 8 2024 at 13:05

Не думаю, что это запустится в termux, но теоретически можно было бы написать нативное приложение для андроид, которое будет использовать маленькую модель распознавания речи. Вот с пунктуацией сомневаюсь, там модель больше и ест около 2 гигов оперативки.

prohfessor Apr 9 2024 at 09:37

Вот здесь пример такого приложения:
https://github.com/alphacep/vosk-android-demo
Распознавалка на маленькой модели. Работает вполне пристойно

Ioldyz Apr 8 2024 at 12:55

Смущает скрин, а именно то что написано "изменено".

Потом сообразил, не успел отредактировать сообщение.

CodeName33 Apr 8 2024 at 12:57

Бот сначала выводит сообщение о том, что начал распознавать текст, а потом, чтобы не плодить сообщения, редактирует это сообщение вставляя туда этот текст. Так что "изменено" будет у всех сообщений бота.

Ugli Apr 8 2024 at 17:31

Единственное, чего я не понимаю, так это, почему люди могут нажать "микрофончик" и отправить голосовое, но нажать другой "микрофончик", который преобразует речь в текст и отправить текст они не могут. Вероятно, они либо не знают про этот функционал, либо используют такое количество слов паразитов, мычаний и пауз, что распознанный текст выглядит совсем уж неприглядно.

и таки мы получим текст с бэ, мэ , паузами и паразитами))
зы: как-то, выйдя из себя на кучу голосовух когда я не мог их слушать мне попался запрос контактов ответственного лица, ну я и продиктовал в том же стиле, выдержал паузу и сказал "только там не 4, а 5"

Prince5000 Apr 8 2024 at 17:38

Я на голосовые неспешно, размеренно, максимально подробно и с разъяснениями отвечаю голосовыми

AzaBroflovski Apr 9 2024 at 10:54

тоже возьму на вооружение

dunyaandreev Apr 9 2024 at 10:35

А если бот ответил на голосовое собеседника, значит ли это, что я не увижу сообщение в списке диалогов как "непрочитанное"? То есть при ответе на сообщение, оно ведь автоматически считается прочитанным? Так ведь можно упустить что-то важное или не очень)

dunyaandreev Apr 9 2024 at 10:37

Или автор считает, что важные сообщения голосовыми не бывают?)

CodeName33 Apr 9 2024 at 10:51

Бот специально устанавливает статус чата "не прочитано", но вроде как и без этого в мобильном приложении чат остается не прочитанным, когда бот получает сообщения. Так что с этим проблем нет, проверил.

kh0 Apr 10 2024 at 00:42

А если все с ног на голову? Пишем параллельный кастомный клиент, который палит все личные чаты на голосовухи, распознает и отвечает "голосовавшим": "распознанный текст" - я правильно тебя понял? Если "голосующий" отвечает "да" или "да". То клиент успокаивается, а если "нет", то отвечает: "тогда попробуй перефразировать" и удаляет опционально старый "перевод". И пусть они там между собой договариваются: Земля вращается - каждый своим делом занимается.

CodeName33 Apr 10 2024 at 06:11

Пишем параллельный кастомный клиент, который палит все личные чаты на голосовухи, распознает и отвечает "голосовавшим": "распознанный текст" - я правильно тебя понял?

Да, все верно

Если "голосующий" отвечает "да" или "да". То клиент успокаивается, а если "нет", то отвечает: "тогда попробуй перефразировать" и удаляет опционально старый "перевод"

Тогда он может ответить "нет", перевод удалится, а его голосовое останется, его такой вариант устроит и он не будет ничего дальше делать) Надо тогда и его голосовое тоже удалять.