Комментарии 24
т.е. мы тут можем проверить установил ли себе человек какого либо умного ассистента чтобы его не беспокоили левые звонки от сомнительных личностей со странными вопросами
Мы работаем с телефонными розыгрышами.
Всё равно не понял. Подробнее расскажите, пожалуйста, кто вы и чем занимаетесь. Зачем вам понадобилось определять автоответчик?
Очевидно, чтобы определить, стоит ли тратить время на разыгрывание. Перевести деньги на безопасный счет, в шутку конечно же
Не, в самом деле, это что за фигня?
На старте мы использовали Whisper. Он решал сразу две задачи:
расшифровка речи
примитивная детекция автоответчиков по ключевым фразам
...Один и тот же сценарий мог быть:
реальным человеком
умным автосекретарём
IVR банка
Кому и зачем может понадобиться звонить в банк в автоматическом режиме и класть трубку, если попал на автомат?
У нас сервис телефонных розыгрышей. Это автоматические звонки с заранее записанными сценариями: человек получает входящий вызов и слышит правдоподобный диалог, который в итоге оказывается шуткой.
Определение автоответчика нам нужно по практической причине. Если трубку берёт не человек, а голосовая почта или автоответчик, сценарий просто «уходит в пустоту». В таком случае розыгрыш не срабатывает как задумано, портится впечатление у заказчика и тратятся ресурсы на бесполезный звонок. Подобные звонки мы возвращаем, как раз для этого и было сделано автоопределение.
Что-то сомнительно. В чем ваш профит? На чем вы деньги зарабатываете?
Мы зарабатываем на самих розыгрышах. Пользователь выбирает сценарий, оплачивает звонок, мы его совершаем. Чтобы развеять сомнения, в статью была добавлена ссылка на проект.
Пользователь сам не знает кого разыгрывает? Интересная забава.
/позевывая/ А сколько реально используется голосовых моделей в автоответчиках? Не быстрее было создать их слепки по тембру, высоте и чему там еще, и искать совпадение по этим характеристикам?
Моделей очень много, и они постоянно меняются. Появляются новые TTS, обновляются старые, у операторов всё по-разному. Делать слепки по тембру пришлось бы бесконечно поддерживать и обновлять. Поэтому мы пошли другим путём - анализируем поведение в диалоге, а не сам голос.
А нельзя детектировать по фоновым шумам?
Не ну вот этот признак проверки на бота, а не человека вообще зашибись:"отсутствие реакции на абсурд, мат, угрозы". Интересная у вас контора, которая при взаимодействии с "клиентами"(лох не мамонт?) использует такие методы ведения диалога. С технической стороны читать было интересно, а с моральной противно, т.к создаётся впечатление что статью писала СБ того самого банка.
В начале статьи прямо указано, что мы работаем с телефонными розыгрышами. Мы не «взаимодействуем с клиентами» в таком формате - мы проигрываем готовые аудиозаписи сценариев. Они бывают разными, в том числе абсурдными или провокационными - это часть жанра.
Проверяется не «метод общения», а реакция на нестандартную реплику. Если отвечают автоответчик или IVR, никакой живой реакции не будет.
Перед тем как делать выводы о морали компании, стоит внимательно прочитать, о чём вообще идёт речь.
Если оно выглядит как утка и крякает как утка - оно скорее всего утка и есть.
Я когда то слышал по радио такую передачу. Там клиент сам предоставляет телефон разыгрываемого и всю необходимую информацию. А вот когда клиент приносит базу из 100500 холодных номеров.. Это какая то несмешная шутка. Но наверное денежная.. pecunia non olet
Ссылка на проект указана в самом начале статьи. Там же описано, как всё работает.
Никаких «баз из 100500 номеров» нет - пользователь сам указывает конкретный номер и выбирает сценарий из списка. Это разовые звонки по инициативе заказчика, а не массовый обзвон.
Поэтому непонятно, откуда вообще взялись такие выводы. Лучше опираться на текст статьи, а не на собственные догадки.

Как мы научились определять продвинутые автоответчики