Comments 30
давно посещала мысль взять родной клиент телеги и немного пофикить его, чтобы заветная кнопка транслита появлялась не только с премом а сообщения на разшифровку улетали не туда куда их телега шлёт а куда нибудь куда я хочу. но лень оказалась сильнее.
Для начала нам нужно получить ключи разработчика телеграм, это легко: https://core.telegram.org/api/obtaining_api_id
Легко-то легко, но:
Due to excessive abuse of the Telegram API, all accounts that sign up or log in using unofficial Telegram API clients are automatically put under observation to avoid violations of the Terms of Service.
здесь я расскажу, как я попробовал решить для себя эту проблему
Я обычно, либо просто игнорю эти сообщения, либо, если это невозможно (шеф, к примеру отправил, хотя у меня такого еще не бывало, это гипотетически) всячески откладываю его прослушивание. Это мотивирует таких любителей поговорить использовать текст в чатах, если им нужна оперативность. Ну а если что-то прямо горит капец как - есть, блин, телефон!
И вот удивительно.. как-то на одном из прошлых проектов один коллега сильно любил эти голосовые сообщения и фигачил их в рабочий чат без остановки, я вообще ни одного не прослушал, и ничего не потерял от этого.
кто-то в ответ на голосовые начинает отправлять видео, как он на бумаге пишет ответ, или как он набирает его в ворде
интересный вариант, надо попробовать)
Когда некоторые любители голосовых не понимают, что слушать их опусы, как правило, срочные, у меня нет возможности, сообщаю об этом. Если понимания не возникает, второе сообщение могу вовсе проигнорировать до появления подходящих обстоятельств прослушивания. Если голосовые продолжают сыпаться (почему-то это происходит в перемешку с текстовыми о срочности), дублирую первое сообщение переведенное в qr-код. Картинкой. Не только лишь все догадываются, что такое сообщение можно прочитать, приложив примерно те же усилия, что с переводом голосового в текст, но моя совесть после этого абсолютно чиста.
Жду когда телега позволит запрещать голосовые в личных чатах
Она позволяет. Тем кто покупает Premium)
Но даже премиум не запрещает и не блркирует сторисы((
Все сторизы вроде нельзя, но если подержать палец на конкретном сторизе, то можно срыть сторизы этого человека и так медленно и методично скрывать их все)
Поставьте клиент, который позволяет. Это по сути базовая функция любого клиента
Альтернативные клиенты в помощь. На Винде есть 64gram, на ведре TurboTel (а также несколько других), на огрызке NiceGram, например. И строим можно отключить, плюс ещё несколько полезных свистоперделок: например, показ айди юзера или группы в профиле (удобно для разработки и дебага).
Она позволяет, но я делал бота, который просто удаляет в ЛС голосовые)
В случае, если голосовые данные обрабатываются или хранятся на серверах мессенджера или сторонних сервисов, это может вызывать опасения по поводу их защиты и возможности несанкционированного доступа к ним. В целом это интересное технологическое достижение, но его реализация должна учитывать важные аспекты безопасности, конфиденциальности и соблюдения законодательства.
А совсем-совсем локально, прям на телефоне, где установлен мессенджер? termux?
Не думаю, что это запустится в termux, но теоретически можно было бы написать нативное приложение для андроид, которое будет использовать маленькую модель распознавания речи. Вот с пунктуацией сомневаюсь, там модель больше и ест около 2 гигов оперативки.
Вот здесь пример такого приложения:
https://github.com/alphacep/vosk-android-demo
Распознавалка на маленькой модели. Работает вполне пристойно
Смущает скрин, а именно то что написано "изменено".
Потом сообразил, не успел отредактировать сообщение.
Единственное, чего я не понимаю, так это, почему люди могут нажать "микрофончик" и отправить голосовое, но нажать другой "микрофончик", который преобразует речь в текст и отправить текст они не могут. Вероятно, они либо не знают про этот функционал, либо используют такое количество слов паразитов, мычаний и пауз, что распознанный текст выглядит совсем уж неприглядно.
и таки мы получим текст с бэ, мэ , паузами и паразитами))
зы: как-то, выйдя из себя на кучу голосовух когда я не мог их слушать мне попался запрос контактов ответственного лица, ну я и продиктовал в том же стиле, выдержал паузу и сказал "только там не 4, а 5"
Я на голосовые неспешно, размеренно, максимально подробно и с разъяснениями отвечаю голосовыми
А если бот ответил на голосовое собеседника, значит ли это, что я не увижу сообщение в списке диалогов как "непрочитанное"? То есть при ответе на сообщение, оно ведь автоматически считается прочитанным? Так ведь можно упустить что-то важное или не очень)
А если все с ног на голову? Пишем параллельный кастомный клиент, который палит все личные чаты на голосовухи, распознает и отвечает "голосовавшим": "распознанный текст" - я правильно тебя понял? Если "голосующий" отвечает "да" или "да". То клиент успокаивается, а если "нет", то отвечает: "тогда попробуй перефразировать" и удаляет опционально старый "перевод". И пусть они там между собой договариваются: Земля вращается - каждый своим делом занимается.
Пишем параллельный кастомный клиент, который палит все личные чаты на голосовухи, распознает и отвечает "голосовавшим": "распознанный текст" - я правильно тебя понял?
Да, все верно
Если "голосующий" отвечает "да" или "да". То клиент успокаивается, а если "нет", то отвечает: "тогда попробуй перефразировать" и удаляет опционально старый "перевод"
Тогда он может ответить "нет", перевод удалится, а его голосовое останется, его такой вариант устроит и он не будет ничего дальше делать) Надо тогда и его голосовое тоже удалять.
Распознаем голосовые сообщения Telegram без СМС и пересылок ботам