Не зря в прошлом году Telegram открыл доступ к расшифровке голосовых сообщений. Пользователям куда проще прочитать текст, чем переслушивать записи, особенно когда речь идёт о десятках и сотнях звонков в месяц. Именно поэтому стоит затронуть механизм транскрибации звонков и сообщений через API и облегчить будни тех, кто уже ищет способ автоматизации в своей компании или контакт-центре.
Транскрибация может быть довольно трудоемким и затратным процессом, особенно если это делать вручную. В среднем на ручную транскрибацию 15-минутной записи уходит не меньше 30 минут, к тому же услуги транскрибаторов обходятся недёшево: от 1 500 руб. в час. Такие ценники можно увидеть на биржах вроде Zapisano, YouDo, Workzilla и FL. К счастью, существует множество инструментов и сервисов, которые могут автоматизировать этот процесс.
Например, МТС Exolve. Из этой статьи вы узнаете, как начать работу с платформой, зарегистрироваться на ней, настроить параметры аккаунта, выбрать подходящие инструменты и воспользоваться преимуществами транскрибации.
Начало работы
MTС Exolve — облачный сервис, который использует Voice API — технологию для подключения функций вызовов в сторонние продукты, а заодно машинное обучение для преобразования речи в текст с высокой точностью и скоростью. С помощью Voice API разработчики могут создавать голосовых помощников, интерактивные голосовые системы и другие решения, использующие голос для взаимодействия с пользователями.
Эти функции Voice API позволяют создавать полноценных виртуальных ассистентов, способных распознавать самих пользователей, их речь и общаться с ними голосом.
Для начала использования Exolve разработчику необходимо зарегистрироваться. Каждый пользователь получает 300 ₽ для тестирования: покупки номера и услуг. Подробнее о возможностях тестового аккаунта можно почитать здесь.
Настройка параметров аккаунта
Для настройки параметров аккаунта в МТС Exolve необходимо войти в свой аккаунт и перейти в раздел «Настройки» или «Профиль». Здесь вы сможете изменить пароль, а также выбрать предпочтения для использования сервиса. Вы также можете добавить и подтвердить свой номер телефона, чтобы использовать функции звонков и SMS.
Методы транскрибации
Одно из основных преимуществ автоматической транскрибации — скорость и эффективность. Алгоритмы машинного обучения могут обрабатывать большие объемы аудиозаписей за короткое время, что делает этот метод идеальным для расшифровки длинных записей разговоров с клиентами или интервью с пользователями.
Автоматическую транскрибацию можно настроить для распознавания конкретных терминов и фраз, что позволяет улучшить точность. При высочайшем качестве связи существующих провайдеров связи автоматический перевод речи в текст оказывается не менее эффективным, чем ручной.
Ручная транскрибация
Считается, что ручная транскрибация может подойти для расшифровки аудиозаписей с конфиденциальной или чувствительной информацией. В этом случае человек-оператор может гарантировать, что информация будет точно и безопасно донесена в тексте. Но всё больше пользователей всё равно прибегают хоть к какой-то автоматизации, через программы вроде LossPlay. Поэтому в таких случаях нужно учитывать риск утечки данных.
Exolve успешно работает с конфиденциальной информацией, и в отличие от человека не передаст данные третьим лицам. Платформа специализируется на точных транскрибациях записей разговоров, поэтому предлагает формат полной детализированной транскрипции.
Пользователи могут отслеживать статус расшифровки в реальном времени. Платформа предоставляет удобные форматы вывода, в частности JSON, также в ближайшее добавится TXT.
Примеры использования транскрибации
Транскрибация звонков
Вы можете использовать транскрибацию для преобразования разговоров в текст. Это может быть полезно для контактных центров, которые хотят сохранять записи разговоров с клиентами для последующего анализа, улучшения качества обслуживания и улучшения скриптов.
Примеры технической реализации транскрибации
Вот примеры использования МТС Exolve с JavaScript кодом для транскрибации звонков и голосовых сообщений:
Звонки
Чтобы транскрибировать звонки с помощью МТС Exolve, рекомендую сразу заглянуть в документацию, а затем выполнить несколько шагов:
1. Создать новый звонок, передав объект с параметрами звонка, такими как номер телефона, на который осуществляется звонок (to), номер телефона, с которого осуществляется звонок (from), и флаг записи звонка (record).
2. После создания звонка, получить идентификатор записи разговора, передав в качестве параметра идентификатор звонка.
3. После завершения транскрибации, вывести текст транскрибации в консоль с помощью console.log.
Код для транскрибации звонков с помощью MTC Exolve будет выглядеть следующим образом:
```
// Создание нового звонка
const call = await exolve.createCall({
to: '+79001234567',
from: '+79007654321',
record: true
});
// Получение идентификатора записи разговора
const recordingId = await exolve.getCallRecordingId(call.id);
// Транскрибация записи разговора
const transcription = await exolve.transcribeRecording({
recordingId: recordingId,
language: 'ru-RU'
});
// Вывод текста транскрибации в консоль
console.log(transcription.text);
```
Голосовые сообщения
Чтобы транскрибировать голосовые сообщения с помощью MTС Exolve, необходимо:
1. Создать новую голосовую SMS с помощью метода createVoiceSms.
2. Получить идентификатор записи голосового сообщения с помощью метода getVoiceSmsRecordingId.
3. Транскрибировать запись голосового сообщения с помощью метода transcribeRecording.
Пример кода:
// Создание новой голосовой SMS
const voiceSms = await exolve.createVoiceSms({
to: '+79001234567',
from: '+79007654321',
fileUrl: 'https://example.com/voice.mp3'
});
// Получение идентификатора записи голосового сообщения
const recordingId = await exolve.getVoiceSmsRecordingId(voiceSms.id);
// Транскрибация записи голосового сообщения
const transcription = await exolve.transcribeRecording({
recordingId: recordingId,
language: 'ru-RU'
});
console.log(transcription.text);
```
Для взаимодействия с Exolve API используется библиотека exolve-sdk-js. Для установки библиотеки необходимо выполнить команду `npm install exolve-sdk-js`, затем импортировать библиотеку в свой проект и создать экземпляр класса Exolve с указанием токена доступа для авторизации в Exolve API. После этого можно использовать методы библиотеки для взаимодействия с API.
Добавлю, что МТС Exolve предоставляет услугу расшифровки записей разговоров по цене 0.60 руб. за минуту, включая НДС. Оплата прозрачна и простая, без дополнительных сборов. Ряд конкурентов предлагают фактически ту же услугу по более высокой стоимости, вплоть до 16 рублей за минуту.
Заключение
Выше лишь база для того, чтобы двинуться дальше и создать свою механику расшифровки. В любом случае, благодаря таким алгоритмам машинного обучения и профессиональным платформам, сейчас куда выгоднее интегрировать API в свои проекты и использовать подобные сервисы с высокой точностью транскрибации, чем отдавать деньги за ручные расшифровки.
При этом, нередко в похожих сервисах вы можете выбирать уровень детализации транскрибации, от простого текста до подробного протокола с указанием временных меток и говорящих лиц.
Автор: Роман Андреев