Pull to refresh

Comments 33

Хорошая статья, в ней есть то, чего не хватает многим другим -- как принимались решения на каждом шаге, почему выбрали то, а не это и т.д.
У ВК хорошее решение по расшифровке голосовых.

@nestyme Дорогая Надежда Зуева,

Это все замечательно и очень увлекательно, но.

Пожалуйста, пожалуйста, ПОЖАЛУЙСТА, сделайте в настройках профиля галочку
"Запретить другим пользователям отправлять мне голосовые сообщения".

Пожалуйста.

Просто не отвечайте на войсы, чем это будет отличаться от галочки в настройках? Ах да, не получится в комментах пожаловаться.

UFO just landed and posted this here

В идеале отправляющей стороне должно приходить сообщение "Пользователь запретил отправлять ему голосовые сообщения". Ну и картинка, где Кирилл и Мефодий даруют людям азбуку.

Я себе такое сделал сам в телеграмме: бот моментально отправляет сообщения мол я заблокировал голосовые сообщения. Можно поступить даже более радикально: сразу автоматически их удалять.

Интересная статья, хороший технический уровень НО- можно сделать галочку в настройках "Не получать голосовые сообщения"?! Чтобы этот мусор мне вообще в принципе нельзя было отправить?

Это все хорошо, но почему я вижу расшифрованные сообщения только на мобильном клиенте, а не на ПК?

Есть в беклоге у команды сообщений. Очень ждем, сама их пингую)

Имхо это должно в самом высшем приоритете стоять. Прошло уже три миллиарда лет с момента запуска фичи на мобилках, а на десктопах кот не валялся. ЗА ШО ВЫ ТАК С НАМИ )

Зашёл в статью и сразу в комменты, чтобы увидеть эти сообщения. Пингуйте ещё чуть-чуть чаще :)

Было приятно читать статью, спасибо!
Есть ли в планах открывать апи распознавания для сторонних разработчиков?

Мы очень хотим и в планах есть, но пока есть трудности разного характера которые нам нужно побороть)

С другой стороны, записать голосовое зачастую удобнее, чем напечатать сообщение — ведь это можно делать параллельно с другими занятиями, на ходу или за рулём

но ведь для таких людей гугл сделали микрофончик на клавиатуре(да и эпл наверно тоже), жмешь на него, наговариваешь сообщение и оно превращается в текст, всем удобно, и людям которым некаиф печатать, и людям которые не любят получать голосовые сообещния. Под каким предлогом сервисы продавили свои решения по отправке именно голосовых сообщений? И теперь решают созданное ими же неудобство по превращению этих записей в текст

но ведь для таких людей гугл сделали микрофончик на клавиатуре

С большой вероятностью распознается косячная фигня, особенно в шуме. При анализе голосовых в таком случае можно хотя бы прослушать звук, а при голосовом вводе останется только то, что распозналось клавиатурой.

Если даже такая настройка будет и вы запретите присылать вам голосовые, останутся еще групповые чаты и там проблема просто не решается.

Странно запрещать отправку голосовых в чате, если у одного участника из 10 стоит запрет, а остальные 9, наоборот, хорошо к ним относятся. Поэтому придется разрешать, а там расшифровка по-прежнему нужна.

Вы потеряли всё комьюнити , лучше бы музыку вернули бы для начала , а потом уже сервисы пилили , а то получается что это все в холостую когда народ от вас массово сваливает .

Дуров верни стену!

Кстати и Дурова тоже потеряли , контакт падает а телега растёт

UFO just landed and posted this here

Голосовое распознавание есть уже довольно продолжительное время, а в обычные браузеры так и не завезли.

UFO just landed and posted this here

Большая работа проделана, молодцы! В open source не планируете выкладывать?

спасибо! Пока об этом не думали) Но если речь про обучение моделей, а не про пайплайн, то в опенсорсе есть неплохие либы. Например NeMo

Столько работы проделано, а ведь Гугл с Эпплом уже давно все это реализовали, причем для любого приложения, а не только ВКонтакте. Правда народ почему то предпочитает отправлять эти вот голосовые сообщения вместо встроенного во все смартфоны распознавания голоса.

Но у вас там разве никому не пришло в голову, что если одна команда ВКонтакте пилит голосовые сообщения, а другая пилит распознавание их обратно в текст, то что то здесь не так? Может просто убрать эти голосовые сообщения к дьяволу?

nestyme
В комментариях просят добавить возможность запретить присылать голосовые сообщения. Судя по отсутствию ответов, данная фича не планируется. Можно узнать что думают в ВК по этому поводу?
Получается, система расстановки знаков препинания вообще никак не учитывает паузы говорящего между словами? Если на вход ей скармливается просто текст.

А какой знак ставится на месте паузы? Разве что многоточие.

Грамматические паузы.

Так пауза делается там, где есть знак препинания. А не знак ставится там, где автор хочет сделать паузу.

Sign up to leave a comment.