masasibata13 фев в 04:31

Как мы научились определять продвинутые автоответчики

Средний

4 мин

Машинное обучение * Искусственный интеллектПрограммирование * Спам и антиспам

Из песочницы

-1

Комментарии 24

NutsUnderline 13 фев в 06:08

т.е. мы тут можем проверить установил ли себе человек какого либо умного ассистента чтобы его не беспокоили левые звонки от сомнительных личностей со странными вопросами

Anselm_nn 15 фев в 03:08

Специально установил Еву что б она деньги на интерчендже у спамеров тянула, мелочь, а приятно

wl2776 13 фев в 06:22

Мы работаем с телефонными розыгрышами.

Всё равно не понял. Подробнее расскажите, пожалуйста, кто вы и чем занимаетесь. Зачем вам понадобилось определять автоответчик?

randomsimplenumber 13 фев в 07:20

Очевидно, чтобы определить, стоит ли тратить время на разыгрывание. Перевести деньги на безопасный счет, в шутку конечно же

wl2776 13 фев в 12:27

Не, в самом деле, это что за фигня?

На старте мы использовали Whisper. Он решал сразу две задачи:
расшифровка речи
примитивная детекция автоответчиков по ключевым фразам

...
Один и тот же сценарий мог быть:
реальным человеком
умным автосекретарём
IVR банка

Кому и зачем может понадобиться звонить в банк в автоматическом режиме и класть трубку, если попал на автомат?

randomsimplenumber 13 фев в 13:57

Ну, освежают базу номеров.

masasibata 13 фев в 16:23

При анализе записей иногда встречались и IVR банков. Как они туда попадали, точно сказать не можем - возможно, это разновидности автоответчиков или переадресации на стороне абонента. На общей выборке таких случаев было немного, но они встречались.

masasibata 13 фев в 16:12

У нас сервис телефонных розыгрышей. Это автоматические звонки с заранее записанными сценариями: человек получает входящий вызов и слышит правдоподобный диалог, который в итоге оказывается шуткой.

Определение автоответчика нам нужно по практической причине. Если трубку берёт не человек, а голосовая почта или автоответчик, сценарий просто «уходит в пустоту». В таком случае розыгрыш не срабатывает как задумано, портится впечатление у заказчика и тратятся ресурсы на бесполезный звонок. Подобные звонки мы возвращаем, как раз для этого и было сделано автоопределение.

wl2776 13 фев в 17:43

Что-то сомнительно. В чем ваш профит? На чем вы деньги зарабатываете?

masasibata 13 фев в 17:52

Мы зарабатываем на самих розыгрышах. Пользователь выбирает сценарий, оплачивает звонок, мы его совершаем. Чтобы развеять сомнения, в статью была добавлена ссылка на проект.

randomsimplenumber 13 фев в 19:50

Пользователь сам не знает кого разыгрывает? Интересная забава.

masasibata 13 фев в 19:58

Пользователь знает, кого разыгрывает - он сам указывает номер при заказе. Мы просто технически совершаем звонок по выбранному сценарию. Если отвечает не человек, а автоответчик, розыгрыш не имеет смысла, поэтому мы стараемся это определять и такие звонки возвращаем.

randomsimplenumber 14 фев в 05:46

Всегда мечтал разыграть банк.

masasibata 14 фев в 08:52

🤡

ifap 13 фев в 12:18

/позевывая/ А сколько реально используется голосовых моделей в автоответчиках? Не быстрее было создать их слепки по тембру, высоте и чему там еще, и искать совпадение по этим характеристикам?

masasibata 13 фев в 16:17

Моделей очень много, и они постоянно меняются. Появляются новые TTS, обновляются старые, у операторов всё по-разному. Делать слепки по тембру пришлось бы бесконечно поддерживать и обновлять. Поэтому мы пошли другим путём - анализируем поведение в диалоге, а не сам голос.

ifap 15 фев в 17:13

Модели голоса меняются быстрее, чем модели построения диалогов?

kolabaister 13 фев в 22:24

А нельзя детектировать по фоновым шумам?

masasibata 14 фев в 08:52

Нет, одних фоновых шумов недостаточно.

У человека может быть идеальная тишина, а у автоответчика - записанный «комнатный» фон. Это слишком ненадёжный признак, даёт много ошибок, поэтому его можно учитывать только вместе с другими сигналами.

Merced 14 фев в 02:25

Не ну вот этот признак проверки на бота, а не человека вообще зашибись:"отсутствие реакции на абсурд, мат, угрозы". Интересная у вас контора, которая при взаимодействии с "клиентами"(лох не мамонт?) использует такие методы ведения диалога. С технической стороны читать было интересно, а с моральной противно, т.к создаётся впечатление что статью писала СБ того самого банка.

masasibata 14 фев в 08:51

В начале статьи прямо указано, что мы работаем с телефонными розыгрышами. Мы не «взаимодействуем с клиентами» в таком формате - мы проигрываем готовые аудиозаписи сценариев. Они бывают разными, в том числе абсурдными или провокационными - это часть жанра.

Проверяется не «метод общения», а реакция на нестандартную реплику. Если отвечают автоответчик или IVR, никакой живой реакции не будет.

Перед тем как делать выводы о морали компании, стоит внимательно прочитать, о чём вообще идёт речь.

randomsimplenumber 14 фев в 10:00

Если оно выглядит как утка и крякает как утка - оно скорее всего утка и есть.

Я когда то слышал по радио такую передачу. Там клиент сам предоставляет телефон разыгрываемого и всю необходимую информацию. А вот когда клиент приносит базу из 100500 холодных номеров.. Это какая то несмешная шутка. Но наверное денежная.. pecunia non olet

masasibata 14 фев в 10:05

Ссылка на проект указана в самом начале статьи. Там же описано, как всё работает.

Никаких «баз из 100500 номеров» нет - пользователь сам указывает конкретный номер и выбирает сценарий из списка. Это разовые звонки по инициативе заказчика, а не массовый обзвон.

Поэтому непонятно, откуда вообще взялись такие выводы. Лучше опираться на текст статьи, а не на собственные догадки.

ifap 15 фев в 17:22

пользователь сам указывает конкретный номер

Но не свой, разумеется, что никак не снимает вопрос этичности, да и вопрос законности тут прям-таки напрашивается.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий