В другой статье. Я подготовил RFM анализ для нашего сервиса eSputnik, чтобы понять картину с нашими клиентами. Мне понравился этот метод, как очень простой способ визуализации поведения клиентов. Да, это было интересно, но очень скоро я понял, что в этой картинке нет практической пользы.
В цифрах вообще нет пользы, если они не меняют наших действий на завтра.
В этот раз я поделюсь с вами опытом и наблюдениями как извлекать пользу из RFM даже не имея трёхлетней истории продаж . Мы провели RFM анализ для десятков различных магазинов и столкнулись с рядом преград на пути к получению реальных результатов. До того как описать их все, давайте ещё раз вспомним, что нам даёт RFM. RFM анализ основан на 3 показателях:
Мне кажется, показатель Monetary не обязательно привязывать к деньгам. Это может быть любой фильтр, наложенный на основные показатели этого метода: Давность и Частота. Например, для информационного портала можно взять время просмотра страницы или глубину просмотра страниц на сайте. RF матрицу можно рассматривать отдельно для разных типов клиентов, фильтруя по источнику клиента, по регионам, по категориям купленых товаров, по возрасту и многое другое.
Если разбить всех ваших клиентов по давности последней покупки на несколько групп и по количеству сделанных покупок, то можно построить матрицу из которой видно как разбить ваших клиентов по группам, на основании их активности:
На самом деле групп гораздо больше, но об этом потом. Обычно я строю шкалы по частоте и давности, по принципу: от плохого к хорошему. Получается:
Об этом мы уже писали и раньше, но давайте посмотрим детальнее как разбить базу на группы и разметить шкалы, сколько групп выделить и что с ними делать дальше.
Самый важный показатель - «Давность». Чем больше времени прошло с момента последней продажи, тем меньше вероятность следующей покупки. И падает эта вероятность очень стремительно. Давайте разберёмся с «Давностью» с самого начала. К примеру, у нас есть 3 клиента (квадрат, круг, треугольник), и на графике мы отметим время когда каждый клиент делал покупку.
Важно , прошу прощения, я почему-то нарисовал график давности в обратном направлении от хорошего к плохому, исправлю, но чуть позже:(
Задача - определить сколько клиентов по «Давности» попадёт в каждый из периодов. Важно понимать, что давность - это показатель, который принимает во внимание только последнюю покупку, предыдущие покупки будут отмечены в частоте. Таким образом правильным ответом на задачку будет:
И снова вопрос: какой из трёх вариантов лучше?
Часто я слышу что «красный (3)» - потому что он стабильный. На самом деле, он показывает что мы постоянно привлекаем клиентов, которые делают покупку и не возвращаются снова. Хорошо что показатель немного нарастает, но всё же «сиреневый (1)» - лучше. По нему видно, что большинство нашей аудитории недавно покупали и сильно вовлечены в процесс покупки. Конечно, самый плохой - «зеленый (2)» график.В этом случае у нас был всплеск активности (может быть Новый год или сильные инвестиции в контекст), а потом всё растеряли.
В большинстве книг по анализу, в том числе в популярном издании «Маркетинг на основе баз данных» Артура М. Хьюза, предлагается очень простой механизм разделения «Давности» по сегментам: отсортировать все контакты по давности и разбить на 5 равных групп. То же самое рекомендуется сделать и с Частотой и с Деньгами:
Этот способ работает и помогает разбить всех клиентов на: покупали только что, недавно, так себе, давно, очень давно относительно друг друга. Но что значит «когда»? Если мы не можем сказать точно «когда», то и оценивать эту группу тоже тяжело. Например, в соседние группы могут попасть контакты покупавшие в один и тот же день. Это лишь значит, что для одинаковых клиентов мы будем по разному себя вести... Зачем тогда вообще такой анализ? Всю глубину проблемы я постараюсь показать на двух примерах:
Пример 1 : В вашем магазине всё было хорошо, и вдруг в течение месяца ни одной покупки. Всё плохо, но если разбивать на равные части - ничего не изменится и всё те же последние покупатели попадут в сегмент «только что покупали».
Пример 2 : Если у вас ещё нет данных о продажах за несколько лет, а Вы только начали свой бизнес, то границы с каждым днём будут очень сильно отличаться и пользоваться результатом такого анализа вообще нет смысла.
Сезонности, акции и праздники тоже сильно влияют на общую картину.
Любой сегмент контактов, о которых вы не можете сказать что-то определённое - плохой сегмент
Мне кажется логичнее фиксировать не количество, а время. Тогда оптимизация количества в группах и будет нашей задачей. Надо как можно больше получить контактов в группе «только что» и как можно меньше «давно».
Осталось только определить какие временные пределы лучше выставить. Для этого надо ответить для себя на несколько вопросов:
Для компаний, у которых нет данных, можно предположить эти периоды. Для компаний «с историей» очень помогут несколько графиков (о которых я расскажу дальше) с разницей между покупками.
Я привёл пример графика с разницей в месяцах между первой и второй покупками. У большинства магазинов он выглядит примерно также, как на рисунке. Тут видно, что 50% всех повторных покупок делаются в течение 2 первых месяцев. За полгода 75% процентов делают свой второй заказ и 90% из тех кто покупают снова - покупают в течение 13 месяцев. Какой из этого можно сделать практический вывод? Мне кажется, ненадо спешить давать скидку тем, кто купит и так, без нашей помощи. Предлагать скидку надо через 2 месяца после первой покупки. До этого надо показывать релевантные предложения, быть на слуху и главное - быть полезным клиенту.
Если построить матрицу разности между любыми соседними покупками, то получится примерно следующая картина:
Интересно, что разница между первой и второй покупкой всегда больше, чем между второй и третьей. А между второй и третьей больше, чем между третьей и четвёртой, но чем дальше, тем меньше влияет количество покупок на разницу между ними. Выходит, что вначале человеку надо время, чтобы поверить. Возможно, в следующий раз он попробует купить в другом месте или просто подождёт. Но чем чаще он покупает, тем время между покупками становится меньше. Джим Ново в своей книге Drilling Down говорит, что этот график сначала падает, потом стабилизируется, потом начинает расти. Это очень похоже на жизненный цикл клиента, когда он понемногу перестаёт быть клиентом, все реже покупая. Но я ни разу не видел этой картины на практике.
Важно : для получения этих цифр лучше использовать не среднее, а медиану. Сейчас быстро попытаюсь объяснить разницу. Среднее - это сумма всех значений делённая на их количество, а медиана - это значение элемента, который находится посередине в отсортированной последовательности. То есть гарантировано 50% всех значений меньше или равны медиане, и 50% больше или равны медиане. Медиана лучше среднего, потому что в средних значениях сильное влияние имеют «аномальные значения». Те значения, которые очень редкие, но сильно выходящие за пределы большинства. Обычно медианы значительно меньше средних.
Ещё хорошо бы посмотреть на сезонность - часто это 12 месяцев. Посмотрев на все цифры можно сделать вывод, какой период поставить для групп, например:
Но даже с таким подходом есть вопросы. А что если у одних клиентов естественный период покупки маленький, а у других большой? В таком случае я создаю каждому из клиентов профиль и для каждого профиля создаю свою градацию, которую нормализую по оси Давности в относительные категории:
Точно такая же история и для «Частоты», только почти всегда у меня получается приблизительно одна и та же шкала. Те, кто сделали:
Ну вот и весь RF анализ. Если посмотреть на матрицу RF, зная как разбиты сегменты, то сразу понятно кто такие новички: совершили одну покупку совсем недавно. Одноразовые - совершили покупку давно, и уже наверняка забыли об этом. Вряд ли они придут к нам снова. Джим Ново говорит, что таких клиентов всегда 50-60% от всей базы клиентов и с этим надо смириться. Я обычно вижу 70% от всей базе в этом грустном сегменте. Для того, чтобы убедиться, что сегмент грустный можно попробовать вернуть кого-то и для этого Джим Ново предлагает стратегию - «смириться», но если не верите, то начните с:
Если не удается их вернуть - вам никого не получится вернуть.
Единственная возможность вернуть покупателей за второй покупкой - обратиться к ним как можно быстрее. Но не слишком рано
Обратитесь слишком рано и будете навязчивым и будете предлагать лишние убийственные для бизнеса скидки.
Давайте посмотрим на RF в динамике. Интересно, что по шкале давности мы всегда начинаем с хорошего (только что купили) и скатываемся к плохому (давно не покупал). И как только сделана покупка, мы всегда возвращаемся снова в самый оптимистичный сегмент:
С частотой все наоборот. Начинаем всегда с самого плохого сегмента (1 покупка) и с каждой покупкой становимся лучше. Шансов вернуться обратно практически нет (если считать частоту за какое-то окно (например, 2 года), то частота может уменьшаться)
А теперь посмотрим на всю картину целиком в матрице RF:
Мы всегда начинаем в сегменте «Только что» и с «1 покупки». А мечтаем, чтобы все клиенты попали в сегмент VIP. И самый короткий путь для этого - постоянные покупки. Если со старта клиент ничего не делает, он «сползает» по Давности в «редко», в сегмент «Одноразовых клиентов». Наша цель - не дать ему уйти. Для этого и созданы автоматические реанимационные письма;)
Есть ещё один тонкий момент: что делать если пауза «затянулась» и клиент не покупал очень давно (значительно превышая жизненный цикл клиента). Мне кажется, в таком случае если он и придет к нам снова, то только если мы снова его «купим» контекстом, сео или разонравится тот магазин, где он все это время покупал. В любом случае к нам придёт совсем другой человек с другими интересами и возможностями. Поэтому мы предлагаем как в детской игре сделать «сброс».
Особенности такого подхода к RFM в том, что его можно применять в первый же день использования магазина. Сразу настроить триггера основанные на неактивности клиента. Следить за динамикой активности ваших клиентов. Кого вы теряете? Что надо сделать, чтобы вернуть клиентов тогда, когда это ещё возможно?
На этом я обзорную статью заканчиваю, и обещаю написать следующую, в которой постараюсь дать ответы на такие вопросы:
Хороших клиентов вам, пусть они все идут по самому короткому пути от Новичков в VIP:)
С тех пор как в компании Mindbox впервые произнесли Machine Learning, общей целью стала Большая Зеленая Кнопка. Это такая кнопка во весь экран, при нажатии на которую всё работает само и приносит прибыль.
В аналитическом проекте «RFM» цель менее амбициозная — Маленькая зеленая кнопка. Нажимаешь, и база автоматически делится на сегменты, по которым запускается отправка писем (например).
Новая кнопка в нашей системе
Чтобы добиться цели, мы написали автоматический RFM-сегментатор и разработали специальный отчет, чтобы наглядно представлять результаты.
Рассказываем, как это все случилось и почему теперь можно обойтись без аналитиков уделять больше времени менее тривиальным задачам.
Результат email-рассылки зависит от охвата аудитории и качества самой рассылки. Бесконечно увеличивать охват нельзя, а значит, нужно увеличивать качество. Для этого рассылку нужно персонализировать, так как все люди разные и каждому нужно что-то свое.
Потребителей обычно много, сделать индивидуальное письмо под каждого сложно. Чтобы справиться с проблемой, маркетологи делят потребителей на группы — сегменты.
Делить можно по-разному. Один из вариантов — RFM-анализ .
То есть RFM-анализ — это способ сегментации. Сегментами называются непересекающиеся группы потребителей. RFM-анализ предлагает для каждого покупателя выделить три признака:
Многие маркетинговые компании делают и используют RFM-анализ. Мы в том числе. В статье про RFM-сегментацию рассказали, какой отчет умеем делать, и как он может помочь маркетологам.
Существующие подходы к RFM-анализу у всех примерно схожи.
Клиентов делят на группы по каждому признаку. Обычно таких групп не больше пяти. Пересечения групп называют сегментами.
Так выглядит сегментация потребителей с помощью RFM-анализа. Здесь каждый признак разбит на три группы, а некоторые группы разбиты на подгруппыНапример, при делении на четыре группы по каждому из трех признаков образуется 64 (4x4x4) сегмента потребителей, а на пять — уже 125 сегментов.
Основная сложность — определить границы групп, потому что нет определенного правила, как это делать.
Рассмотрим наиболее популярные подходы на примере одной базы клиентов:
Мы используем только два измерения (R и M) из трех для удобства восприятия.
В нашем примере:
При этом подходе разделение делается исходя из из значений признаков. В нашем случае выделяем три группы по тратам: до 5 тысяч рублей, от 5 до 10 тысяч и от 10 тысяч. И три группы по давности срока покупки: до 80 дней, от 80 до 160 дней, от 160 дней.
Получаем девять сегментов.
Плюсы метода:
Минусы метода:
При таком подходе разделение по каждому признаку выполняется так, чтобы в группы попадало одинаковое количество потребителей.
Вот так распределяются покупатели из нашего примера (по-прежнему делим на три части по каждому признаку):
Плюсы метода:
Минусы метода:
Аналитик изучает базу данных и подбирает правильное разделение.
Плюсы метода:
Минусы метода:
Мы решили избавиться от недостатков старых подходов. Для этого пришлось прибегнуть к алгоритмам .
Используя методы кластеризации, мы автоматически определяем, сколько же на самом деле сегментов потребителей в базе и что это за сегменты. А с помощью решающего дерева приводим эти сегменты к удобному для восприятия виду. Как это работает, рассказали в статье про устройство сегментатора .
Для примера выше мы получили вот такой результат:
Чтобы все это было удобным и понятным для маркетологов, мы разработали отчет, в котором удобно и понятно (как нам кажется) описаны результаты сегментации.
Чтобы получить его, достаточно нажать одну кнопку — и система все сделает сама.
Отчет помещается на одну страницу и состоит из трех таблиц.
Первая таблица — сводная. В ней собрана информация по всем сегментам базы, полученная на основе RFM-анализа. Ключевые показатели: активность потребителей в сегменте и их ценность.
Активность определяется давностью последней покупки, а ценность — потраченной суммой.
Каждый сегмент относится к одной из категорий. В каждой категории может быть несколько сегментов или вообще не быть ни одного. В ячейках указано общее количество потребителей из всех сегментов категории.
P.S. Здесь выражения “Отток” и “Риск оттока” используются как сокращения для “Давно не покупавшие клиенты” и “Клиенты, покупавшие среднее количество времени назад” и не означают отток в прямом смысле этого слова. Аналогично, “Активные” — обозначение для “Клиенты, недавно сделавшие покупку”.
В примере выше 80% клиентов не имеют покупок, почти треть высокоценных — в оттоке, еще треть — в группе риска.
Оценка состояния базы помогает выбрать категорию, с которой важно работать в первую очередь.
Чтобы показать, как пользоваться отчетом, возьмем клиентов с высокой ценностью, то есть клиентов, потративших больше всего денег.
Во второй таблице отчета выводятся: размер сегментов, оборот, то есть сумма, потраченная всеми потребителями в сегменте, и средний чек.
Все сегменты потребителей представляются списком. Например, вот список сегментов покупателей, имеющих покупки.
Чтобы вывести в отчет только потребителей с высокой ценностью, используем фильтр.
В результате применения фильтра получаем семь сегментов потребителей с высокой ценностью.
На основе этой информации можно сделать разные выводы.
Например, сегмент №2 имеет значительно больший оборот, чем другие, при умеренном среднем чеке. Это говорит о большом числе покупок потребителей в этом сегменте и их высокой лояльности. Не опасаясь оттока клиентов, им можно рассылать письма и рассказывать, например, о новинках.
Теперь обратим внимание на средний чек: сегмент №7 с самым большим средним чеком находится в оттоке, а сегмент №9 со вторым по величине средним чеком — в группе риска. Потребители из данных сегментов готовы покупать на крупные суммы, но не покупали уже давно. Возможно, имеет смысл побудить их к действиям с помощью промокода или информационного письма.
Изучение сегментов нужно, чтобы понять, с какими сегментами стоит усиленно поработать.
В последней таблице показаны границы сегментов по каждому признаку (R, F, M) и средние значения по ним
Нам нужно выбрать, с каким сегментом мы хотим работать первым. Допустим, нас заинтересовали сегменты с самыми большими средними чеками: №7 и №9. Рассмотрим их подробнее.
В сегменте №7 клиенты не делали покупки почти год — вернуть их будет нелегко. Но, возможно, попробовать стоит, поскольку в среднем потребители из данного сегмента покупали 2,1 раза — это значит, что первая покупка их не разочаровала. Вполне вероятно, что хорошая скидка поможет им снова активно заинтересоваться брендом.
С сегментом №9 проще — средняя давность покупки у клиентов из него составляет всего три месяца, а среднее количество покупок — 2,8. Скорее всего, эти клиенты достаточно лояльны и не требуют по отношению к себе никаких действий. Но можно отправить письмо с рекламой или небольшой скидкой, чтобы напомнить о бренде.
Когда сегменты для дальнейших действий выбраны, можно запускать нужные маркетинговые кампании.
Мы создали автоматический RFM-сегментатор и остались довольны — нужно 20 секунд времени человека, чтобы получить распределение базы клиентов по сегментам.
Мы собираемся автоматизировать настройку маркетинговых кампаний для сегментов, чтобы человеку и на это не нужно было тратить время.
Конечно, жалко будет, что никому больше не понадобится наш отчет, но технический прогресс не щадит никого.
Специалист по машинному обучению
Лана Шакирова
Контент-маркетолог
Recency Frequency Monetary
Анализ ассортимента товаров и услуг компании по частоте обращения (покупки, заказа и т.д.). Аналогичен ABC-анализу товарных позиций, если в качестве параметра брать число обращений. Используется для определения доходности клиентов, позволяет оценить вероятность их ухода, изучить лояльность клиентов.
RFM-анализ чаще всего используется для изучения товарного ассортимента по частоте обращений, а также его применяют для классификации клиентов.
Основу RFM-анализа составляют следующие характеристики:
В начале таблицы располагаются постоянные клиенты, которые чаще всего приносят основную часть прибыли. Для этих клиентов можно разработать специальные предложения. Клиенты с кодом RF=15 являются новыми, и если в этой группе есть те, чей показатель Monetization равен 5, то на них стоит обратить особое внимание.
Все клиенты, от «транжир» до «почти потерянных покупателей» имеют различные потребности и желания, и, соответственно, по-разному реагируют на маркетинговые кампании.
Для выполнения RFM-анализа сначала следует разделить клиентов на четыре равные группы, согласно распределению значений давности, частоты и величины покупок.
Четыре равные группы (квартили) с тремя переменными образуют 64 (4x4x4) клиентских сегмента, с такими цифрами вполне можно работать.
Заметьте, что вы можете использовать квинтили (пять равных групп) для лучшей детализации, однако, работа с 125 сегментами (5x5x5) может показаться непростой задачей.
Давность (R) | Частота (F) | Деньги (M) |
Квартиль 1 (R=1) | Квартиль 1 (F=1) | Квартиль 1 (M=1) |
Квартиль 2 (R=2) | Квартиль 2 (F=2) | Квартиль 2 (M=2) |
Квартиль 3 (R=3) | Квартиль 3 (F=3) | Квартиль 3 (M=3) |
Квартиль 4 (R=4) | Квартиль 4 (F=4) | Квартиль 4 (M=4) |
Например, есть один клиент, и он:
Данный клиент принадлежит RFM-сегменту 1-1-1 (Лучшие клиенты), (R=1, F=1, M=1).
Вот самые важные RFM-сегменты:
Сегмент | RFM | Описание | Маркетинговая деятельность |
Лучшие клиенты | 1-1-1 | Клиенты, совершившие последние покупки, делающие это чаще остальных, и тратящие денег больше остальных | Без ценовых стимулов, новые продукты и программа скидок для постоянных клиентов |
Лояльные клиенты | X-1-X | Клиенты, совершившие последние покупки | Изучите их R и M для дальнейшей сегментации |
Транжиры | X-X-1 | Клиенты, тратящие больше остальных | Продвиньте самые дорогие продукты |
Почти потерянные клиенты | 3-1-1 | Не совершали покупки некоторое время, но покупали часто и тратили больше остальных | Агрессивные ценовые стимулы |
Потерянные клиенты | 4-1-1 | Не совершали покупки давно, но покупали часто и тратили больше остальных | Агрессивные ценовые стимулы |
Потерянные экономные клиенты | 4-4-4 | Не совершали покупки давно, покупали мало и тратили меньше остальных | Не прикладывайте много усилий к их возвращению |
Чтобы провести RFM-анализ, вам понадобятся данные о всех покупках, совершенных всеми клиентами. Это должен быть файл с информацией, обычно экспортируемый из вашего бухгалтерского ПО или транзакционной базы данных.
Шаг 1. Скачайте скрипты для RFM-анализа и файлы примеров с Githtub .
Шаг 2. Подготовьте файл CSV со всеми покупками или же используйте шаблон sample-orders.csv. Имена столбцов должны быть теми же.
order_date | order_id | customer | grand_total |
2016-01-01 | US-52653 | john | |
2016-01-02 | US-52654 | mary | |
… | … | … | … |
Шаг 3. Запустите скрипт RFM-analysis.py, находящийся в папке, куда вы поместили файл с данными. В скрипте есть три аргумента:
>python RFM-analysis.py -i sample-orders.csv -o rfm-segments.csv -d "2014-04-01"Это создаст RFM-сегменты в CSV-файле с названием rfm-segments.csv или иначе, а зависимости от того, что было задано вами с параметром -o.
Клиент | Давность | Частота | Сумма | Сегмент RFM |
Мария Н. | 4 дня | 58 покупок | $2 869 | 1-1-1 |
Владимир У. | 50 дней | 1 покупка | $44 | 3-4-4 |
Екатерина А. | 47 дней | 2 покупки | $156 | 3-2-1 |
Эти простые шаги и есть сегментация клиентов. Теперь определите кого-нибудь прочесывать базу данных клиентов и выявлять наиболее важных для вашего бизнеса.
Или же создайте собственную настройку в , как ниже, чтобы визуализировать данные:
Теперь пришел черед email маркетинга. Ниже приводится пошаговый RFM-анализ:
1. Выберите RFM-сегмент, нужный вам (Лучшие клиенты, Почти потерянные клиенты, итд).
2. Решите как лучше всего поступить с данным RFM-сегментом
3. Определите задачу для данных email кампании и RFM-сегмента
4. Настройте отслеживание конверсии e-mail маркетинга
5. Создайте еще одну email версию, привзяанную к RFM-сегменту, нужному вам
6. Запустите кампанию по A/B-тестированию через email, когда контрольная группа получает обычную версию письма, а экспериментальная группа — письмо, выбранное согласно RFM-сегменту
7. Проанализируйте результаты и повторите — чаще то, что действует и реже то, что не действует
RFM является относительно простой техникой, с чьей помощью возможно существенно улучшить вашу маркетинговую деятельность.
Обновляйте RFM-сегментацию путем автоматизирования процесса, например, с помощью скрипта RFM-анализа. Лучше всего обновлять данные каждый день.