Обновить

Как мы научились определять продвинутые автоответчики

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели6.9K
Всего голосов 3: ↑1 и ↓2-1
Комментарии24

Комментарии 24

т.е. мы тут можем проверить установил ли себе человек какого либо умного ассистента чтобы его не беспокоили левые звонки от сомнительных личностей со странными вопросами

Специально установил Еву что б она деньги на интерчендже у спамеров тянула, мелочь, а приятно

Мы работаем с телефонными розыгрышами.

Всё равно не понял. Подробнее расскажите, пожалуйста, кто вы и чем занимаетесь. Зачем вам понадобилось определять автоответчик?

Очевидно, чтобы определить, стоит ли тратить время на разыгрывание. Перевести деньги на безопасный счет, в шутку конечно же

Не, в самом деле, это что за фигня?

На старте мы использовали Whisper. Он решал сразу две задачи:

  • расшифровка речи

  • примитивная детекция автоответчиков по ключевым фразам


    ...

    Один и тот же сценарий мог быть:

    • реальным человеком

    • умным автосекретарём

    • IVR банка

Кому и зачем может понадобиться звонить в банк в автоматическом режиме и класть трубку, если попал на автомат?

Ну, освежают базу номеров.

При анализе записей иногда встречались и IVR банков. Как они туда попадали, точно сказать не можем - возможно, это разновидности автоответчиков или переадресации на стороне абонента. На общей выборке таких случаев было немного, но они встречались.

У нас сервис телефонных розыгрышей. Это автоматические звонки с заранее записанными сценариями: человек получает входящий вызов и слышит правдоподобный диалог, который в итоге оказывается шуткой.

Определение автоответчика нам нужно по практической причине. Если трубку берёт не человек, а голосовая почта или автоответчик, сценарий просто «уходит в пустоту». В таком случае розыгрыш не срабатывает как задумано, портится впечатление у заказчика и тратятся ресурсы на бесполезный звонок. Подобные звонки мы возвращаем, как раз для этого и было сделано автоопределение.

Что-то сомнительно. В чем ваш профит? На чем вы деньги зарабатываете?

Мы зарабатываем на самих розыгрышах. Пользователь выбирает сценарий, оплачивает звонок, мы его совершаем. Чтобы развеять сомнения, в статью была добавлена ссылка на проект.

Пользователь сам не знает кого разыгрывает? Интересная забава.

Пользователь знает, кого разыгрывает - он сам указывает номер при заказе. Мы просто технически совершаем звонок по выбранному сценарию. Если отвечает не человек, а автоответчик, розыгрыш не имеет смысла, поэтому мы стараемся это определять и такие звонки возвращаем.

Всегда мечтал разыграть банк.

🤡

/позевывая/ А сколько реально используется голосовых моделей в автоответчиках? Не быстрее было создать их слепки по тембру, высоте и чему там еще, и искать совпадение по этим характеристикам?

Моделей очень много, и они постоянно меняются. Появляются новые TTS, обновляются старые, у операторов всё по-разному. Делать слепки по тембру пришлось бы бесконечно поддерживать и обновлять. Поэтому мы пошли другим путём - анализируем поведение в диалоге, а не сам голос.

Модели голоса меняются быстрее, чем модели построения диалогов?

А нельзя детектировать по фоновым шумам?

Нет, одних фоновых шумов недостаточно.

У человека может быть идеальная тишина, а у автоответчика - записанный «комнатный» фон. Это слишком ненадёжный признак, даёт много ошибок, поэтому его можно учитывать только вместе с другими сигналами.

Не ну вот этот признак проверки на бота, а не человека вообще зашибись:"отсутствие реакции на абсурд, мат, угрозы". Интересная у вас контора, которая при взаимодействии с "клиентами"(лох не мамонт?) использует такие методы ведения диалога. С технической стороны читать было интересно, а с моральной противно, т.к создаётся впечатление что статью писала СБ того самого банка.

В начале статьи прямо указано, что мы работаем с телефонными розыгрышами. Мы не «взаимодействуем с клиентами» в таком формате - мы проигрываем готовые аудиозаписи сценариев. Они бывают разными, в том числе абсурдными или провокационными - это часть жанра.

Проверяется не «метод общения», а реакция на нестандартную реплику. Если отвечают автоответчик или IVR, никакой живой реакции не будет.

Перед тем как делать выводы о морали компании, стоит внимательно прочитать, о чём вообще идёт речь.

Если оно выглядит как утка и крякает как утка - оно скорее всего утка и есть.

Я когда то слышал по радио такую передачу. Там клиент сам предоставляет телефон разыгрываемого и всю необходимую информацию. А вот когда клиент приносит базу из 100500 холодных номеров.. Это какая то несмешная шутка. Но наверное денежная.. pecunia non olet

Ссылка на проект указана в самом начале статьи. Там же описано, как всё работает.

Никаких «баз из 100500 номеров» нет - пользователь сам указывает конкретный номер и выбирает сценарий из списка. Это разовые звонки по инициативе заказчика, а не массовый обзвон.

Поэтому непонятно, откуда вообще взялись такие выводы. Лучше опираться на текст статьи, а не на собственные догадки.

пользователь сам указывает конкретный номер

Но не свой, разумеется, что никак не снимает вопрос этичности, да и вопрос законности тут прям-таки напрашивается.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации