Business Data Analytics. Технологии добычи знаний и интеллектуального анализа данных. Data mining Сайт www.BusinessDataAnalytics.ru
предлагает актуальные материалы
об алгоритмах и технологиях
добычи знаний и интеллектуального
анализа данных.
Документ: Businesss Data Analytics / Статьи / Адресная рассылка /

Адресная рассылка

Проблема

Многие компании используют свою клиентскую базу для информирования своих клиентов о новых предложениях компании. Однако если клиенту слишком часто приходят сообщения, которые ему неинтересны, то через какое-то время он, вероятно, откажется от подписки, и компания потеряет возможность активного контакта с этим клиентом. Таким образом, необходимо обеспечить механизм информирования клиентов только о таких предложениях, которые могут быть для них интересными. Это приведет с одной стороны к уменьшению потока сообщений клиентам, а с другой - предложения станут более адресными, и тем самым, более эффективными.

Задача

На основании описания нового предложения в виде набора его характеристик требуется определить клиентов, которые им могут заинтересоваться.

Решение

Способность того или иного клиента заинтересоваться определенным предложением мы можем оценивать только на основании истории его заказов.

"Наивный" алгоритм

Очевидным и простым решением описанной задачи было бы формирование SQL-запроса, возвращающего всех клиентов, уже заказывавших в прошлом предложения с такими характеристиками. Немного более общее решение - найти всех клиентов, заказывавших в прошлом предложение с данными характеристиками не реже заданного порогового числа раз, чтобы не принимать в расчет единичные, нехарактерные транзакции. Однако это решение нельзя считать хорошим, так как, используя его, мы никогда не сформируем предложение клиентам, которые никогда не заказывали товар или услугу с этими конкретными характеристиками. В рассылку не попадут клиенты, которые могли бы заинтересоваться нашим новым предложением, но еще не совершали подобной сделки в прошлом. Таким образом, при помощи описанного алгоритма рассылки мы не сможем расширить список потенциальных клиентов на наше новое предложение.

Немного более общее решение - найти всех клиентов, заказывавших в прошлом предложение с данными характеристиками не реже заданного порогового числа раз, чтобы не принимать в расчет единичные, нехарактерные транзакции.

Алгоритм, учитывающий похожие предложения

С целью исправления указанного недостатка, мы могли бы включить в список рассылки не только тех клиентов, которые уже заказывали товары или услуги с описанными характеристиками, но также тех, кто заказывал товары или услуги с похожими характеристиками. Для этого мы должны определить меру похожести между различными предложениями, т.е. метрику на пространстве предложений (товаров или услуг), описываемых фиксированным набором их характеристик.

Задание такой метрики можно было бы поручить эксперту, который бы вручную на основании своего опыта проставил степень похожести между различными предложениями. Так, если речь идет о книгах, а характеристики их задаются тематикой, то можно было бы на основании экспертного знания проставить высокую степень похожести между книгами из серии "реклама" и "маркетинг". В результате чего, мы могли бы предлагать новинку по теме "реклама" клиентам, достаточно часто приобретающих у нас книги по маркетингу.

Недостатком экспертного подхода является произвольность полученной метрики. По нашему опыту, для определения показателя схожести предложений гораздо эффективней использовать объективную специфику вашего бизнеса и специфику ваших клиентов, которая хранится в исторических транзакционных данных. При определении такого показателя мы предлагаем использовать относительную частоту (оценку вероятности) совместного вхождения набора предложений в историю продаж клиентам. Так, два предложения мы считаем похожими, если частота их совместного вхождения в историю продаж клиентам высока. На основании анализа совместных вхождений в заказы клиентов различных наборов предложений мы можем сформировать правила вида "Если клиент приобретает товар с характеристиками А и товар с характеристиками Б, то с вероятностью 87% он приобретает товар с характеристиками В". Эти правила мы можем теперь использовать следующим образом: предположим, что мы хотим определить потенциальных покупателей для товара с характеристиками В. Кроме клиентов, уже достаточно часто покупавших товар с характеристиками В, мы предложим его также клиентам, история покупок которых содержит покупку товаров с характеристиками А и Б. С учетом правила, указанного выше, существуют большая вероятность того, что товар с характеристиками В входит в область интересов клиентов, приобретающих А и Б.

Определить правила совместного вхождения различных товаров в заказы. Найти клиентов, история заказов которых свидетельствует о высокой вероятности заказа товара с данными характеристиками.

Этот подход позволит нам увеличить продажи новинок за счет клиентов, интересующихся сходными предложениями, причем степень схожести определяется на основании истории совместных приобретений, т.е. в максимальной мере использует накопленные исторические данные.

в начало страницы