Как стать автором
Обновить

Применение методов CRISP-DM для анализа Big Sales Data

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.4K
Рис.1 Методология CRISP-DM
Рис.1 Методология CRISP-DM

Метод обработки данных, полученных в процессе продажи людьми (звонки/встречи), с целью оптимизации воронки, сокращения цикла сделки и увеличения конверсии.

Основной процесс

Звонки/встречи проводятся с подключением SalesAI. Интеграция с CRM системой позволяет собрать чистые и точные данные, которые можно анализировать инструментами Big Data: Process Mining, Spaghetti Diagram, Reverse Engineering и тд.

Если у нас сформирован качественный и объемный массив чистых данных, мы можем провести операцию Reverse Engineering для оптимизации процесса продаж, например, пересобрать воронку продаж или определить наиболее короткий процесс, или собрать наиболее эффективные тактические приемы/фразы, которые приводят к конверсии с высокой долей вероятности. Обратную задачу тоже можно решить: выявить эпик фейлы в процессе.

Рассказываем подробно, как это выглядит по шагам и какой результат от этого мы можем получить.

Разобьем процесс на этапы, в соответствии с методологией CRISP-DM

Этап

Цели этапа

Выход

Проблемы/риски

Business Understanding

Цель проекта - определить точки роста конверсии продаж. В зависимости от продуктов/регионов и др переменных, за счет глубокого анализа имеющихся внутренних данных. Второстепенная цель - определить внешние данные, которые необходимо учитывать для более точного результата.

Задачи:

• Определить зоны роста

• Определить зоны потерь

• Описать новый эффективный процесс

• Определить метрики эффективности процесса

Объем выборки может быть недостаточен для однозначных выводов. Хранение данных, возможность их получения. Отсутствие интересующих инсайтов для заказчика.

Data Understanding

В идеале, тк все диалоги пропущены через SalesAI и есть интеграция с CRM, то все необходимые данные хранятся в CRM: список событий по каждой сделке, Некоторые записи разговоров/встреч, Записи статусов сделки и связанных с ней объектов, Возможно протоколы встреч, Эл письма, Договоры/НДА, ТЗ, КП (все версии), пресейл документация и тд. Понять сильные и слабые стороны имеющегося набора документов.

Понимание общего объема и категорий данных, доступных для анализа. Обогащение данных с помощью сторонних источников. Определение начальных гипотез для анализа:

Оценка:

  • достаточности данных

  • релевантности данных

Рассчитаны описательные статистики данных (целевых метрик), построены их графики

Корректировка бизнес целей исходя из состояния данных | Проблемы консистентности данных состоят в том, что может быть очень мало полного набора данных, объединенных одним ID сделки: нет исторических данных, данные в CRM с ошибками (90%), не полные, несвоевременно измененные, пропущенные кирпичики, не сохранились документы, или хранятся в разных местах, нечитабельные, коммуникация велась не в санкционированных каналах, которые не подлежат учету и тд. Основная проблема постфактум будет состоять в сборе полной цепочки событий по каждой сделке (Data Evidence). Иначе точность анализа будет слишком низкой. Именно поэтому сложно сделать ретроспективный анализ, потому что необходимо долго ковыряться в архивах, чтобы все найти.  Для наиболее эффективного пути, сначала внедряется Политика управления Данными и  SalesAI, потом собираются данные, затем проводится анализ по собранным данным. | | Data Preparation | Допустим, у нас не сложные сделки, которые проводятся по телефону и нет долгих переписок и обменов документами. КП переделывается максимум один раз. Допустим, надо разобраться, что и как говорить по телефону менеджеру, чтобы конверсия росла сама. Тогда нам необходимо взять весь объем имеющихся записей звонков за последние 3-24 месяца и провести подготовительную работу. | Подготовка датасетов:

  1. Выстраивание звонков (событий) в хронологические цепочки в привязке к каждому ID сделки, тк в рамках одной сделки у нас может быть несколько этапов переговоров.

  2. Транскрибирование/распознавание голоса в текст.

  3. Разметка данных этап 1. нам необходимо определить цель каждого звонка и каждому разговору присвоить лейбл. Если звонок был полезный. Например, у нас могут быть звонки с целью квалификации лида, могут быть с целью закрытия сделки и тд. Также инициатором звонка может быть клиент, или менеджер, это тоже нам необходимо отразить в свойствах.

  4. Разметка данных этап 2, более глубокого уровня: разложить каждый звонок на элементы контекста, что происходило внутри. Здесь, возможно, придется использовать гипотезу, в рамках которой определить набор сущностей и разложить все в рамках заданного набора сущностей, либо набор гипотез и у каждой гипотезы будет свой набор сущностей. В дальнейшем можно будет определить, какая гипотеза оказалось наиболее успешной.

  5. Провести Кластеризацию моделью и сравнить результаты с используемыми гипотезами. | • Качество распознавания • набор гипотез может быть ложным и дать фейковые срабатывания • выбор не тех сущностей и тд • мало неразорванных цепочек | | Modeling | Визуализация данных и создание скоринговой модели | 1. Определить репрезентативность выборки: Диаграмма Спагетти, которая позволит показать: • количество полных цепей • количество успешных цепей • кол-во разорванных цепей событий

  6. Детализация успешных цепей: • цепочки событий на временном графике, которые увеличивали скоринг лида. С указанием скоринга • КФУ в каждом мейлстоуне • Детализация до ключевых фраз • Успешные фреймворки проведения переговоров

  7. Аналогично по неуспешным цепям

  8. Общие характеристики клиентов, с которыми сделки закрыты успехом: критерии квалификации.

  9. Сколько сделок можно было бы закрыть на том массиве по новому процессу.

  10. Как выглядит новый процесс на графике время/скор | Сложность сделать zoomin/zoomout процесса красиво | | Evaluation | Оценка качества модели Проведение тестовой симуляции (ретроспективный анализ) или пилота в виде А/В-тестирования, например, сколько мы смогли бы продать в прошлом (на том же датасете), если бы применили новый процесс. | Определяем метрики эффективности нового процесса (возможно лучше: оценка эффективности нового процесса определенными заранее метриками)

Разработан дизайн эксперимента в виде А/В-тестирования:

  • определен объем контрольной и целевой выборок

  • длительность проведения эксперимента

  • критерии остановки эксперимента

  • определены ресурсы и технологии, необходимые для проведения эксперимента.

Запущен пилот

Вносим еще итерацию изменений, если необходимо. Повторяем эксперимент, если необходимо, если результат достигнут (метрики изменились), то приступаем к внедрению | Влияние внешней среды Человеческий фактор Сезонность | | Deployment | План внедрения:

  • Внедрение автоматизации сбора данных с помощью SalesAI.

  • Презентация команде результатов анализа.

  • Гиперболизация разницы: сколько потратили и сколько могли бы заработать, если бы работали по другому.

  • Объяснение, как теперь будет выглядеть новый процесс.

  • Какой рутины у них больше не будет

  • Подсказки сейлам в режиме реального времени. | Пайплайн сбора чистых данных и петля обратной связи, которая позволяет изменять элементы процесса и фактически адаптировать процесс под каждый сегмент клиентов или под каждого целевого клиента (ABM в действии). | Человеческий фактор/инстинкт самосохранения Привычки UI/UX Нежелание перестраиваться Изменения внешней среды Сезонность Кривая обучения |

Как стать Data Driven Директором по продажам, наш канал в Telegram: **VP of sales.

Результаты

  1. Одноразовые улучшения процесса на той глубине, на какой у вас есть кластеризация. Это можно сделать вручную, если есть чистые данные.

  2. Непрерывный процесс улучшений процесса вкупе с постоянным получением чистых данных - при использовании SalesAI.

Теги:
Хабы:
Всего голосов 5: ↑4 и ↓1+10
Комментарии0

Публикации

Истории

Работа

Data Scientist
80 вакансий

Ближайшие события

7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань