Как стать автором
Обновить

«ВКонтакте» запустила функцию перевода аудиосообщений в текст

Время на прочтение1 мин
Количество просмотров9.8K
Всего голосов 14: ↑13 и ↓1+23
Комментарии41

Комментарии 41

НЛО прилетело и опубликовало эту надпись здесь
Можно ещё снять и отправить видео, как Вы набираете текст ответа в редакторе.
НЛО прилетело и опубликовало эту надпись здесь

На смартфонах давно не проблема открыть DOCX.

Это если им пользовались. А так даже предустановленный ворд/эксель на самсунгах требует регистрации. Т.е. минут на 5-10 можно человека занять увлекательным квестом.

Если ваши адресаты пользуются устройствами на iOS, то им ваши .docx не помеха — предпросмотр документов офиса есть из коробки в операционной системе.

Это гениально, возьму на заметку.
НЛО прилетело и опубликовало эту надпись здесь

О, а это идея, возьму на вооружение. Уже порядком надоели.

Можно будет написать бота для бесплатного распознавания голоса?

Чтение текста занимает меньше времени, чем его написание. С голосовыми сообщениями — нет. Имеем и неуважение к времени собеседника, и отсутствие стимула к нормальной формулировке фраз. Это лично мое мнение, если что.


Идея может и хорошая, но слова-паразиты, междометия и прочая вода тоже распознаётся же? Думаю, что не особо приятно будет это читать в большинстве случаев. Хотя от автора все зависит.

Насколько я понимаю, функция не навязывается. Она исключительное благо, когда собеседник отправил голос, а именно прослушать его нет никакой возможности: шум, нужна тишина, нежелательное нарушение конфиденциальности, нет наушников, их долго доставать и т.п. Или вы предлагаете убрать голос вообще? А он иногда спасает: например, когда нужно передать что-то набегу, проще нажать одну кнопку и сказать пару слов, чем нажимать на клавиатуру «во все руки». Каждому формату своя задача.

Я сейчас такую америку открою, просто пипец. Если вам некогда отвечать — не отвечайте! :)

Во всех стандартных клавиатурах есть иконка микрофона — жмешь ее и говоришь — текст сам печатается
говоришь — текст сам печатается

About temple church resulting you are the most video

Думаю можно приделать штуку, которая будет править и стилистику текста, а там и до поиска смысла и прочего скайнета недалеко

эта вода всё равно будет лучше в текстовом варианте(если часто читать такое, думаю будет как с баннерной слепотой… глаза пройдут мимо), чем слушать блеяние на 10-15. секунд

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь

Вообще если некоторым особо буйным в ответ на голосовуху слать это сообщение, то они думают, что такая функция реально есть.

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Можно просто убрать из интерфейса диалога соответствующую кнопочку. И заодно сделать это конфигурируемым, чтобы можно было запретить присылать фото, видео, текст, аудиозаписи, файлы, ссылки, и пр. Списком чекбоксов конечно, настройки по-умолчанию для всех, для друзей, для не-друзей, с возможностью сделать для конкретного собеседника отдельные настройки.

В приложении на чужом устройстве? Ну-ну.

НЛО прилетело и опубликовало эту надпись здесь

А зачем? Почему просто не отключить голосовые сообщения? Те, кому лень набирать могу пользоваться распознаванием голоса в клавиатуре.

Работает в обратную сторону. Вот тебе пришло голосовое, а ты не хочешь(не можешь) его слушать — нажал кнопку и прочитал расшифровку.

Я никогда не хочу слушать голосовые. Если б они переводильсь в текст на стороне отправителя, то ещё и место на серверах и трафик экономился.

Теперь товарищ майор будет получать распечатку ваших разговоров бестрее чем вы будете успевать их прослушивать.
Молодцы, ребята
Датасеты для обучения откуда брали?
Действительно, и мне стало интересно, что содержит соглашение ВК по поводу голосовых сообщений? Их обработку, хранение, передачу и так далее…
Подозреваю, что брали через программу тестирования VK Testers
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Не удивлюсь, если где-то госзаказ найдется)
Хорошая возможность, удобная, правда не уверен в стабильности её работы, особенно в плане не совсем популярных слов и шумостойкости.

В священной войне вокруг голосовых сообщений хочу встать на сторону защиты этой функции. Голосовые сообщения — это инструмент. Те, кто страдает косноязычием, и в тексте не шибко приятны: ответы на содержательное текстовое сообщение чем-то вроде «)» или стикера, обилие пунктуационных и орфографических ошибок, неприятная лень в вопросе исправления слов, предложенных автокоррекцией — всё это исходит от тех же людей, которые «ммм ааа аэаэаэээ нннууу вооот» в голосовых.

Аудиосообщения полезны, как уже упоминалось ранее, для записи сообщения на бегу или в неудобных климатических условиях, для сохранения интонационной окраски послания (ненавижу сарказм в тексте!), для передачи не только непосредственно текста, но и звукового окружения, если это необходимо.

Слушать их не всегда удобно — и вот тут как раз приходит на помощь та самая возможность из статьи.
НЛО прилетело и опубликовало эту надпись здесь
Когда я слышу слова «нейросеть восстановила», я лезу проверять бэкапы

Я к тому, что вместо исходников на вход попадает данные из другой ИИ? Не факт, что там не появились артефакты. KPI распознания может и возрасти. Но распознавание ЧЕГО?
картинка из статьи:
image
НЛО прилетело и опубликовало эту надпись здесь
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Истории