Business Data Analytics. Технологии добычи знаний и интеллектуального анализа данных. Data mining Сайт www.BusinessDataAnalytics.ru
предлагает актуальные материалы
об алгоритмах и технологиях
добычи знаний и интеллектуального
анализа данных.
Документ: Businesss Data Analytics / Статьи / Использование Microsoft CRM и методов Data Mining для маркетингового анализа потенциальных сделок компании /

Использование Microsoft CRM и методов Data Mining для маркетингового анализа потенциальных сделок компании

© spellabs it.company, 2007
Максим Гончаров, maxim.goncharov@spellabs.ru

Категория материала: для аналитиков и разработчиков

В статье описаны три аспекта применения методов Data Mining для анализа коммерческих возможностей компании с использованием информации о клиентах из системы Microsoft CRM:

  1. Модель прогноза заключения успешных коммерческих сделок из общего множества потенциальных сделок.
  2. Модель описательного анализа структуры существующих коммерческих возможностей.
  3. Модель профилирования коммерческих возможностей.

В качестве примера используется демонстрационная база Adventure_Works_Cycle_MSCRM.

Определения

Открытая сделка, или открытая возможность - потенциальная сделка.
Закрытая сделка, или закрытая возможность - несостоявшаяся или состоявшаяся сделка.

Структура данных

В анализируемые данных входят:

  1. Характеристики потенциальной сделки: набор входящих в возможную сделку товаров или услуг, ответственный за возможность менеджер, число дней до ожидаемого или фактического завершения, источник возникновения интереса, число уже предпринятых действий.
  2. Демографические характеристики связанного с потенциальной сделкой контакта: возраст, доход, семейное положение, число детей, географические данные.
  3. Транзакционные характеристики связанного с потенциальной сделкой контакта: число связанных с контактом в прошлом возможностей, процент возможностей, завершившихся сделкой, набор уже приобретенных контактом товаров и услуг.

В модель данных входит одна основная и две вложенные таблицы. Основная таблица данных модели формируется запросом на таблицу возможностей, связанную с таблицей контактов. Первая вложенная таблица формируется запросом на товары и услуги, входящие в данную возможность, эта таблица является характеристикой возможности. Вторая вложенная таблица возвращает товары и услуги, которые данный контакт уже приобретал в прошлом, эта таблица является характеристикой контакта.

В модели анализируются только те возможности, которые связаны с контактами. Это обусловлено тем, что организации обладают другим набором атрибутов, чем контакты и, как следствие, анализ возможностей, связанных с ними, требует построения другой модели. Принцип построения такой модели аналогичен описанному.

В обучающую выборку попадают все закрытые возможности.

Структура данных для моделей Data Mining приведена ниже:

рис. 1   Структура данных для моделей Data Mining

рис. 1 Структура данных для моделей Data Mining

рис. 2   Структура данных для моделей Data Mining

рис. 2 Структура данных для моделей Data Mining

Вероятность заключения сделки

Цель построения модели состоит в классификации новых коммерческих возможностей с точки зрения вероятности их завершения сделкой. Для построения модели используются атрибуты закрытых возможностей, завершившихся или не завершившихся сделками, характеристики связанных с ними контактов, а также набор предлагаемых товаров или услуг для прогнозирования вероятности того, что выбранная возможность завершится сделкой.

Алгоритмы

Для решения этой задачи используются следующие классификационные алгоритмы:

  • Дерево решений
  • Нейронные сети

Модель

Все атрибуты модели кроме Sales State являются входными атрибутами, а атрибут Sales State - выходным атрибутом модели. Этот атрибут описывает статус завершения возможности, принимающий значение Won или Lost, в зависимости от того завершилась ли возможность сделкой или нет.

рис. 3 Атрибуты модели

рис. 3 Атрибуты модели

Применение
  1. Анализ факторов в наибольшей степени влияющих на успешность завершения сделки.
  2. Прогнозирование вероятности закрытия потенциальных возможностей для планирования и бюджетирования.
  3. Возможность ранжирования возможных сделок по вероятности их заключения для формирования дифференцированной маркетинговой стратегии.

Результаты

На результат закрытия возможности в наибольшей степени влияют следующие факторы:

  • Процент заключенных сделок для данного клиента
  • Число дней от формирования возможности до ожидаемой даты закрытия
  • Наличие товаров "Women's Mountain shorts, M", "Sport-100 helmet, Red", "Mountain Bike Socks, L" среди покупок клиента в прошлом

рис. 4 Влияние факторов

рис. 4 Влияние факторов

Соответствующее дерево решения выглядит следующим образом (синим обозначена вероятность заключения сделки, оранжевым - закрытия возможности без заключения сделки):

рис. 5 Дерево решения

рис. 5 Дерево решения

Мы можем сделать вывод, что высокими шансами заключения сделки обладают коммерческие возможности с низкой ожидаемой длительностью предпродажной активности и связанные с контактами с высоким процентом заключенных сделок в прошлом.

Сегментация клиентов

Цель построения модели заключается в группировке контактов для улучшения понимания их покупательского поведения на основании их характеристик. Используя эту информацию, мы можем формировать дифференцированную маркетинговую политику для каждой группы, а также анализировать различные показатели деятельности компании в разрезе каждого сегмента клиентов отдельно.

Алгоритмы

Для решения этой задачи используются следующие алгоритмы кластеризации:

  • Максимизации ожидания (Expectation Maximization)
  • K-средних (K Means)

Модель

В модель входят характеристики контактов и возможностей, данные о товарах не включены из-за сложности интерпретации результирующих кластеров. Все анализируемые атрибуты входят в модель с флагом Predict, что означает их участие в построении кластеров, а также вычисление значений их распределений внутри каждого кластера, что делает возможным их использования в запросах на прогнозирование.

рис. 6 Анализируемые атрибуты

рис. 6 Анализируемые атрибуты

Применение

После обучения модели она используется для описательного анализа структуры коммерческих возможностей и связанных с ними контактов. Характеристики кластеров позволяют лучше понять имеющуюся в базе данных информацию о возникающих возможностях, входящих в них товарах и контактах.

Результаты

Было выделено 4 кластера

рис. 7 Кластеры сделок

рис. 7 Кластеры сделок

Кластер 1

Возможности с высокой вероятностью преобразования в сделку, с клиентами с одной созданной в прошлом успешной возможностью, женского пола, замужними или ни разу не состоявшими в браке, с высшим образованием.

рис. 8 Кластер сделок №1

рис. 8 Кластер сделок №1

Кластер 2

Кластер 2 похож на Кластер 1 со следующими отличием: в Кластер 2 входят мужчины с докторскими степенями заключившие в прошлом более одной сделки.

рис. 9 Кластер сделок №2

рис. 9 Кластер сделок №2

Кластер 3

В Кластер 3 входят возможности с маленькой вероятностью успеха, с высокой планируемой длительностью предпродажной активности, связанные с клиентами с невысоким процентом успеха в прошлом, женщины, вдовы или разведенные, средним или незаконченным высшим образованием.

рис. 10 Кластер сделок №3

рис. 10 Кластер сделок №3

Кластер 4

В Кластер 4 входят возможности с высокой вероятностью преобразования в сделку, с контактами, создавшими большое количество возможностей в прошлом со средним коэффициентом успешности преобразования в сделку, мужчины, с бакалаврским образованием, из Нью-Йорка, женатые.

рис. 11 Кластер сделок №4

рис. 11 Кластер сделок №4

Можно сделать вывод, что наименее успешные клиенты для компании - это разведенные женщины или вдовы без высшего образования с низким коэффициентом успеха в прошлом и с длительным сроком оценки предпродажной деятельности.

Профилирование возможностей и контактов

Целью создания модели служит создание профилей возможностей, контактов и товаров по заданному частичному набору характеристик этих объектов. Таким образом, модель призвана выявить наиболее вероятные неизвестные характеристики объектов при заданном наборе известных характеристик.

Алгоритм

Для решения этой задачи мы применяем "наивный" алгоритм Байеса.

Причина выбора этого алгоритма, а не, скажем, более точного алгоритма дерева решений, заключается в том, что в нашу задачу входит прогнозирование целевых атрибутов на основании неполного набора входных атрибутов. Для дерева решений атрибуты не являются равнозначными: так, если какой-то атрибут не задан, то по нему не производится разбиение дерева и, следовательно, не учитываются все остальные атрибуты, следующие в дереве за ним. Для "наивного" алгоритма Байеса все атрибуты равнозначны: если не задан какой-либо из них, он всего лишь не принимает участие в формировании результаты прогноза, при этом все остальные заданные атрибуты учитываются в этом прогнозе.

Модель

Все атрибуты модели имеют флаг Predict, что позволяет использовать их в качестве как входных, так и выходных параметров.

рис. 12 Атрибуты модели

рис. 12 Атрибуты модели

Применение

Обученная модель применяется для решения следующих задач:

  1. Выявления характеристик успешных возможностей
  2. Определения профиля "хорошего" контакта
  3. Определения контактов, которые приобретут определенный набор товаров
  4. Определение набора товаров, который приобретут контакты с определенными характеристиками

Результаты

Ниже приведены примеры профилирования.

Пол и образование контактов, которые приобретут в мае следующие товары:

  • Women's Mountain shorts, L
  • Women's tights, S
ПолОбразование
ЖенскийДиплом о высшем образовании

Аналогичный запрос на товары:

  • Taillights - battery powered
  • Cable Lock
дает следующий результат:
ПолОбразование
МужскойНезаконченный колледж

Характеристики контакта, коммерческие возможности которого почти всегда быстро становятся сделкой

ПолОбразованиеСемейное положениеЧисло детей
МужскойДиплом о высшем образованииЖенатМенее 2-х

Характеристика "плохого" контакта:

ПолОбразованиеСемейное положениеЧисло детей
ЖенскийСреднее образованиеВдоваБолее 5

Вывод

Таким образом, алгоритмы Data Mining, реализованные в рамках платформы Microsoft Analysis Services 2005 позволяют значительно расширить существующую функциональность CRM-системы с точки зрения анализа, моделирования и прогнозирования коммерческих возможностей компании. Применение описанного подхода к анализу данных позволяет маркетинговому подразделению компании существенно повысить качество своей работы и, как следствие, повысить эффективность бизнеса компании.

в начало страницы