Недавно Amazon открыл полностью автоматизированный магазин, где нет продавцов, кассиров. Это событие спровоцировало новый виток обсуждений тренда на замещение роботами людей во многих областях бизнеса (например, вот статья по теме в The Guardian). Мне удалось поговорить с Дмитрием Плотниковым, экспертом по автоматизации бизнес-процессов (Microsoft MVP), о том, кому на самом деле пора начинать переживать за свои рабочие места.

Ты много работаешь в сфере автоматизации бизнес-процессов. Можешь поделиться наблюдениями о том, места каких сотрудников скоро займут роботы?


Вообще, в интернете уже несколько лет публикуются разные списки профессий, которые уничтожат роботы (например, вот и вот), — там всё время называют рабочих с фабрик, водителей или официантов. На самом деле из того, что мы видим, раньше других проблемы могут возникнуть как раз у офисных сотрудников.

Это, например, у кого?


Например, сотрудники колл-центров, которые занимаются холодными продажами с помощью телефонных звонков. Обычно у оператора есть четкий сценарий разговора (скрипт), в котором прописано, что и как он должен говорить. Отклоняться от него чаще всего запрещается. И даже если возникает ситуация, которая скриптом не обрабатывается, операторам полагается повторять только те фразы, что есть в их скрипте, — остальное под запретом.

То есть человек, как робот, будет повторять одни и те же слова. А раз так, то почему бы не заменить его роботом, ведь это позволит сэкономить: программу не нужно обучать, она может работать круглосуточно и без выходных.

Но в данном случае получается, что система должна будет вести голосовую беседу, а это еще сложнее, чем чат-бот. Есть ли в этой сфере сейчас какие-то заметные успехи?


Да, мне довелось поучаствовать в проекте, где нужно было реализовать как раз такую систему — приложение, которое использует базу SharePoint в качестве CRM и ведет коммуникацию в ходе холодных звонков. Эта система уже запущена и работает у одного из заказчиков из западного региона (компанию назвать, к сожалению, не могу).

Подобных решений на рынке довольно много, большинство из них используют подход, при котором компьютер синтезирует голос человека. Это почти всегда звучит неестественно, разговаривать с таким роботом человеку не очень приятно.

Поэтому в нашем проекте было решено отказаться от синтеза речи и использовать в коммуникациях заранее записанный голос живого человека. В итоге система зачитывает собеседнику предложения из скрипта компании и на лету расшифровывает его ответы, преобразуя их в текст. Одна из важнейших задач здесь — это анализ содержания звонка. По ключевым словам можно понять, как именно человек реагирует на то, что слышит (в этом в том числе помогает поиск по базе знаний), и в зависимости от этого выстраивать дальнейшую коммуникацию — закончить разговор, воспроизвести следующее предложение заранее записанного текста и т. п.

Насколько эффективно это работает?


К удивлению, работает система довольно эффективно и позволяет серьезно экономить и повышать продуктивность холодных звонков. Приложение само может расставлять статусы по итогу бесед в CRM, что очень удобно, и одна программа за день может позвонить сотням клиентов. Затраты на колл-центр, который смог бы выполнить такой же объем работ, были бы очень существенными.

Есть ли какие-то сложности при создании такого рода приложений?


Да, конечно. В том подходе, что мы использовали, есть и свои сложности — например, воспроизвести записанную речь так, чтобы она звучала естественно, не так уж просто. К примеру, в ходе разговора между двумя людьми длительные паузы возникают редко, поэтому и робот должен реагировать на реплики собеседника быстро. При этом в реальной жизни человек, которому поступает звонок, может находиться в шумном месте — и роботу непросто в реальном времени понять, когда адресованная ему фраза закончилась и на нее нужно реагировать.

Точно так же некоторые слова могут звучать одинаково, но иметь разное значение и по-разному записываться (омофоны). Например, в английском языке слово bot и bought звучат одинаково, но обозначают совершенно разные понятия.

Как можно решить эти проблемы и повысить точность?


Машинное обучение, нейросети. У любого колл-центра есть база знаний, как правило довольно обширная: там и скрипты разговора, и их записи (их часто делают, например, для оценки качества работы операторов). Для начала можно создать нейронную сеть и обучить ее на этих данных — расшифрованных записях разговоров. В итоге получится полноценный виртуальный оператор для совершения холодных звонков.

В заключение можно ли дать какие-то советы тем, кто собирается создавать аналогичные системы автоматизации рутинных офисных задач?


В этом деле, пожалуй, самое главное — выбрать подходящие технологии и инструменты. Вряд ли у вас хватит ресурсов на то, чтобы всё делать с нуля самостоятельно, поэтому придется использовать готовые продукты и всевозможные API. И здесь важно, чтобы они имели нужную функциональность и хорошую документацию.

Например, мы в ходе проекта хотели использовать инструменты от Google и Microsoft, но выяснили, что один из них не поддерживает нужные нам языки, а документация второго оказалась настолько плохой, что некоторые моменты прояснялись только в ходе экспериментов. Если этого удастся избежать, вы сэкономите много времени и сил.

Интересные статьи по теме влияния автоматизации на рынок труда: