Изначально чат-боты напоминали обычные автоответчики. Бизнес рассматривал их лишь для замены рутинных операций по перенаправлению пользователя с одного оператора на другого.
Первый прорыв случился с распространением в Телеграм «кнопочного интерфейса ботов», который «де-факто» стал стандартом в области текстовых ботов.
Вторым прорывом можно считать распространение систем преобразования голоса в текст (speech to text), благодаря которым появилась возможность взаимодействовать с системами с помощью голосовых команд.
Третий прорыв возник в области искусственного интеллекта (ИИ), боты стали «человечнее» и взаимодействие с ними перешло из разряда «робот» в разряд «помощник».
Первые образцы чат-ботов разрабатывались в основном для взаимодействия B2C, т.е. как «автоответчик» для потенциального клиента.
Данный тип взаимодействия показал невысокую эффективность в условиях борьбы за потенциального заказчика услуги и до изобретения GPT был практически забыт. Итогом развития этого направления стал широкий охват B2B-сегмента с акцентом на внутреннее использование чат-ботов.
Вместо обслуживания внешних интересов, текстовые боты стали обрабатывать внутренние запросы, например, рассылать новости или давать быстрый доступ к востребованной информации.
Внедрение чат-ботов в HR-процессы компаний
рассылка уведомлений
подготовка шаблонных документов
обмен информацией
проведение опросов среди сотрудников
Основная задача всех текстовых чат-ботов первого образца сводится к стандартизации методов подачи информации. В этом режиме они работают 24/7.
Вместо десятка каналов передачи, таких документов как «заявление на отпуск», выбирается всего лишь один – бот.
В нем можно оперативно получить актуальный шаблон документа и сразу передать подписанный образец, запросить справку 2-НДФЛ, получить выписку по заработной плате или запросить копию трудовой книжки и многое другое.
Особенно полезным оказался инструмент в период пандемии Covid-19, когда потребовалось рассылать и принимать тысячи документов в день для обеспечения прохода сотрудников на рабочие места в торговых объектах.
Помимо этого, неплохо себя зарекомендовал и автоматизированный сбор обратной связи от покинувших компанию сотрудников, а также при формировании списка ценностей компании.
Задача чат-ботов второго уровня была в обучении персонала или его мотивации.
Существует несколько разных продуктов под общим обозначением «учебно-мотивационный комплекс».
Такие комплексы содержат в себе пользовательскую часть в виде текстового чат-бота, операторскую часть в виде WEB-оболочки с отчетами и администраторскую часть, в которой происходит конструирование того, что видят пользователи.
Опыт внедрения таких продуктов показывает высокую вовлеченность пользователей в процесс. Достигается такой результат благодаря системе геймификации и внедрения игровой валюты, которую при необходимости можно менять на реальные призы за достижение лучших результатов.
Такие системы несколько сложнее в управлении, но и пользовательский опыт от работы с такими комплексами гораздо позитивнее.
Успешность текстовых чат-ботов и развитие смежных технологий способствовали дальнейшей эволюции направления:
Нейросети дали возможность распознать голоса
Появилась концепция «умного дома», которой требовалось голосовое управление
Нашлись крупные инвесторы со стороны банковского сектора, которым требовалась готовая технология
Первичный спрос был простым – распознать речь банковских служащих для оценки качества их работы. Такие системы стали прародителями голосовых помощников, так как именно на базе их DataSet-ов в дальнейшем обучались умные устройства.
Органичным развитием этого направления стали боты, которые обзванивают людей «по скрипту».
На этой базе началась конкурентная борьба между «умными устройствами», которая позволила сформировать бизнесу новое видение относительно возможностей применения голосовых чат-ботов.
Внедрение аудио-ботов совместно с системами транскрибации в сегмент B2C, как замена «живому» оператору.
Задача всех аудио-ботов сводилась к экономии средств на операторах колл-центров, а также снижении времени ожидания ответа потребителем услуги. Дополнительным преимуществом являлась возможность транскрибации голоса оператора для выявления отклонений от согласованного шаблона.
Практика показала, что экономию средств и проверку шаблонов такие роботы успешно выполняют, а вот время ожидания ответа не снизилось, так как множество пользователей требовали позвать «оператора».Таким образом негатив от ожидания ответа сменился негативом от «общения с ботом».
Следом появилась ниша спам-звонков, в которых голосовой робот выполняет роль «первой линии обзвона», но без серьезного анализа ответов такие сервисы не вызывали ничего, кроме раздражения конечных получателей услуги.
Как итог появился рынок услуг, предоставляющий услуги транскрибации.
Развитие чат-ботов уверенно двигается к системам «умный помощник».
Однако, многие эксперты оценивают окупаемость таких инвестиций как низкую, считая ИИ-технологии "мыльным пузырем".
Вероятно, что сейчас рынок ищет нишу в которой подобный сервис может выйти на окупаемость хотя бы в среднесрочной перспективе.
На данный момент своими решениями в этой области могут похвастаться только очень крупные компании, которые могут себе позволить громадные инвестиции в обучение собственных моделей.
Остальные довольствуются открытыми интеграциями со всеми вытекающими из этого рисками в виде нестабильности работы сервисов и зависимости от ценовой политики поставщика услуги.
В частности OpenAI начал обсуждение повышения стоимости использования своих сервисов на фоне подъема интереса к ChatGPT.
Автору неизвестны случаи коммерчески выгодных запусков в этой области.
Однако, попытки запуска сервисов на базе ИИ-технологий наблюдаются стабильно.
Так в Китае за 2024 год закрылось ~80 000 стартапов связанных с нейросетями.
Особенности технологии определяют ее дальнейшее развитие и спектр задач, с которыми она будет работать. Уже сейчас понятно, что анализ голоса, видео и изображений невозможен без ML-технологий.
Боты на базе ИИ стремятся завоевать сегмент пользовательского интерфейса, т.е. стать универсальным пультом для взаимодействия с человеком. Вместо десятков интерфейсов остается лишь один – голосовая команда.
А вместо десятка непроверенных источников – один доверенный.
На данном этапе технология находится в стадии НИОКР, когда человек ищет как он может с ней взаимодействовать.
Это замечание подтверждается наблюдениями за детьми, которые, в силу отсутствия иных средств доступа к информации, активно взаимодействуют с умными устройствами.
Таким образом B2C-сектор может ожидать всплеск интереса и возможности монетизации к данному направлению через 10-15 лет, когда станут взрослыми и платежеспособными дети, которые уже сейчас осваивают нюансы голосовых интерфейсов.
Выводы
Сегодня значение имеет не выбор передового бота, а то, как эта технология структурирована и как используется в компании.
В отличие от текстовых ботов и систем транскрибации, запуск ботов на базе ИИ — это сложная и трудоемкая задача, которая потребует объемных инвестиций и серьезного человеческого ресурса.
Из опыта внедрения технологий в разных компаниях и общих тенденций в развитии систем можно сделать несколько заключений:
Системы на базе машинного обучения находятся на этапе становления.
Коммерчески выгодными они не являются, однако могут прекрасно решать шаблонные задачи по формированию текстов и изображений без авторских прав.Внедрение систем перевода голоса в текст позволяет упростить задачу взаимодействия с пользователем до уровня «текстовый чат-бот».
Данный сервис будет полезен и для массовой проверки диалогов на наличие целевых слов.Большинство внутренних процессов любой компании, а так же первую линию коммуникации с клиентами может закрыть обычный текстовый чат-бот на базе стандартных алгоритмов.
Все это говорит о том, что сбрасывать технологию со счетов еще рано и в ближайшем будущем она может показать существенный рост в счет открытия новых методик взаимодействия с пользователями.
Максим Фабрин
Руководитель отдела разработки ПО, Лавка Технологий