Рмф анализ. RFM-анализ одной кнопкой. Применение RFM для базы данных частных клиентов

Офтоп: с тегом RFM на Хабре лишь 2 статьи, и обе из корпоративных блогов. Странно, почему так мало контента по тематике, ведь на Хабре много людей из e-commerce related area?

Однако, бросаю лить воду и предлагаю, для начала, договориться о терминах. Далее под RFM-анализом подразумевается анализ ценности клиента для компании. По сути, слегка продвинутый вариант ABC-анализа , только с фокусом не на товарах, а на клиентах. Во главу угла ставится формализация размера пользы каждого клиента для бизнеса. С целью выявления это пользы каждый клиент рассматривается по следующим параметрам:

R ecency - новизна (время с момента последней покупки)
F requency - частота (частота покупок за период)
M onetary - монетизация (стоимость покупок за период)

Дано :

1. История продаж интернет-магазина в виде.xlsx выгрузки, наподобие

Sic! Не ищите смысла в цифрах, все полу-рандомно изменено на 1-2 порядка

2. ТЗ от собственника, полная версия которого звучит не сложнее фразы «RFM-анализ сделать можешь?»

Результат :

Поначалу, полдня потратил на раздумья «Как все это сделать при помощи вычисляемых объектов сводной таблицы, чтобы было красиво». В итоге, забил на красоту и за час сделал с помощью промежуточного листа и обычных формул типа "=ЕСЛИ" и т.д.

3. Промежуточные вычисления

Для вычисления времени с момента последней покупки необходима текущая дата (стандартная функция в Excel =ТДАТА()) и дата последней покупки клиента. Поскольку выгрузка представляла собой неупорядоченный массив «Дата-Клиент-сумма_покупки», существовала сложность выявления последней даты покупки по каждому из клиентов. Проблема была решена сортировкой по всему объему дат в выгрузке (прошу не винить за «колхозный стиль», но в тот момент на красоту забил, так как хотел максимально быстро реализовать имевшееся в голове решение). Зеленым отмечены колонки первоначальной информации. В первой строке оставил формулы для понимания, а сортировал по колонке в порядке убывания (колонка создана при помощи сцепить)

4. Составные части листа «Итог»

Теперь собираем результат RFM-анализа на одном листе. Начинаем со списка клиентов (сортировка не имеет значения) - копируем с первого листа список клиентов оставляем только уникальные записи при помощи стандартного функционала (Данные - Удалить дубликаты). В колонку B при помощи ВПР тянем дату последнего заказа клиента. Формула в колонке С считает количество заказов клиента по всей выгрузке. В колонке D похожим образом считается сумма заказов по клиенту. А столбец E вычисляет для нас количество дней с момента последней покупки клиентом.


Sic! пример формулы для колонки E указан в ячейке K1, а в самом столбце E сохранены лишь значения для демонстрации результата

5. Recency (время с момента последней покупки)

Суть выделенной формулы в следующем: смотрим в каком из пяти равных промежутков от 0 до максимума (подсвечено в формуле красным) находится значение каждой ячейки колонки Е и проставляем оценку от 1 (клиент, купивший у нас нечто год назад) до 5 (клиент купивший что-либо в последнее время).

6. Frequency (частота покупок за период) и Monetary (cтоимость покупок за период).

Формулы идентичны, поэтому рассмотрим на примере Frequency. В данном случае мы разделили всю совокупность на 3 равных по количеству членов совокупности промежутка и смотрим к какому из этих промежутков относится значение в колонке С с выставлением оценок 1(клиент покупающий у нас реже остальных), 3, 5 (клиент покупающий у нас чаще остальных).

Для тех кому сложно или лениво понять определение медианы в википедии : медиана - это значение, делящее совокупность данных на 2 равные по количеству части. Пример: cреднее арифметическое значение 5 клиентов совершивших 1, 2, 2, 2, 100 покупок = 21,4 (ничего не говорящая нам средняя температура по больнице); медиана для этого же ряда = 2.

Заключение : про сложение всех показателей вместе и сортировку в порядке убывания самой правой колонки листа «Итог» писать не стал - думаю, итак понятно)) Моя цель - создать систему «на коленке», была полностью достигнута. Отдаю «как есть» . Дописывая эти строчки понимаю, что мое определение медианы и пример тоже не самые легкие (для тех у кого не было в университете мат.статистики). Если кто предложит более простой и понятный вариант - заменю.

Каждый предприниматель в процессе развития бизнеса сталкивается с вопросом: как сделать своего клиента более лояльным и не дать ему уйти к конкуренту?

Существует два типа данных, которые можно узнать о покупателях: кто они такие (демографические данные) и что они делают (поведенческие данные). Как правило, маркетологи пытаются предугадать именно поведение клиентов. Ведь если вы планируете продать товар или услугу своим клиентам, то знание, что кто-то из них недавно приобрел несколько предметов общей стоимостью 10000 рублей, ценнее, чем знание их возраста, дохода, семейного положения или другой подобной информации.

Обычно для предсказания поведения клиентов специалисты по директ-маркетингу используют RFM-анализ. Главным становится вопрос, как формализовать размер пользы, принесенной каждым клиентом. Для этой цели изучаются три показателя:

  • Recency - давность продажи (сколько времени прошло с момента последней покупки клиента);
  • Frequency - частота покупок (общее количество покупок в периоде);
  • Monetary - сумма продаж за всю историю (иногда используют средний чек).

Причем, показатель Monetary не обязательно привязывать к деньгам. Это может быть любой фильтр, наложенный на основные показатели этого метода: Давность и Частота. Монетизацию не всегда удается свести к покупкам. Например, для информационного портала можно взять время просмотра страницы или глубину просмотра страниц на сайте.

Как правило, процент покупателей, реагирующий на общие рекламные предложения, невелик. RFM-анализ – это простой и, в то же время, эффективный метод. Используя его, можно предсказать реакцию покупателя, улучшить взаимодействие и повысить прибыль. В зависимости от принадлежности клиента к одной из выделенных групп применяются разные способы воздействия. Важность показателей ранжируется согласно последовательности: Давность, Частота, Сумма продаж.

Применение RFM для базы данных частных клиентов

Рассмотрим небольшую компанию по продаже учебных пособий, которая использовала RFM-анализ для извлечения максимальной прибыли с каждого покупателя. Ежегодно лето всем клиентам рассылались письма с предложением приобрести их продукцию. Затраты на рассылку составляли 15 руб. на одно письмо, прибыль же от каждой продажи - 550 руб. Таким образом, чтобы оправдать затраты на рассылку, необходимо получать более 3% откликов. Но на протяжении нескольких лет доля откликов не превышала 1,6%, что не давало прибыли. Применив RFM, всю существующую базу данных клиентов разбили по 125 ячейкам (5х5х5) и определили долю откликов по каждой из ячеек. Далее рассылку писем стали осуществлять по ячейкам с долей откликов более 3%, что позволило компании в итоге получить прибыль.

Стоит отметить, что непрерывное использование RFM-анализа не пойдет на пользу бизнесу. Если постоянно его применять для решения вопроса: кому из клиентов написать или позвонить, - то некоторые из них вообще никогда не получат от вас известий, а другие - наиболее активно реагирующие, будут испытывать усталость от постоянного внимания, поскольку вы будете связываться с ними слишком часто. Необходимо разрабатывать стратегию контактирования и подумать, с каким предложением можно обратиться к менее восприимчивым клиентам, просто чтобы они знали, что о них помнят.

На практике встречается упрощенный RFM-анализ, который называют RF-сегментация, когда показатель Сумма продаж не используется, потому что его значение часто зависит от Частоты. С помощью такого анализа несложно выделить тех, с кем нужно проводить активную работу, и именно для них разрабатывать специальные предложения.


Применение RFM для базы данных корпоративных клиентов

Рассмотрим применение RFM-анализа к базе данных корпоративных клиентов. Такая база, в большинстве случаев, гораздо меньше базы частных клиентов, и можно прибегнуть к сокращению количества групп. Например, для базы в 10000 записей 125 ячеек RFM-анализа будут иметь всего 80 записей в каждой ячейке, а этого мало для получения статистических результатов. Сократим количество RFM-ячеек до 20 с уменьшенным количеством групп, отсортированных по Частоте и Сумме продаж. Например, 5 - по Давности покупки, 2 - по Частоте и 2 - по Сумме продаж.

В теории RFM-анализа предполагается очень простой механизм разделения Давности, Частоты и Суммы продаж по сегментам: отсортировать все контакты и разбить на 5 равных групп для каждого показателя. Этот способ работает и помогает разбить всех клиентов относительно друг друга на:

  • покупали только что
  • недавно
  • давно
  • очень давно

Но на практике возникает проблема изменения этих показателей во времени.

Бизнес развивается хорошо, но вдруг в течение месяца не совершается ни одной покупки - это плохо. Но если разбить базу данных на равные части - ничего не изменится и всё те же последние покупатели попадут в сегмент «покупали только что».

Новый бизнес ещё не имеет данных о продажах за несколько лет. В этом случае границы с каждым днём будут сильно отличаться и пользоваться результатом такого RFM-анализа вообще нет смысла.

Сезонности, акции и праздники тоже сильно влияют на качество анализируемых данных. Поэтому время стоит фиксировать. Для того, чтобы определиться какие временные интервалы лучше выставить, стоит ответить для себя на ряд вопросов:

  • Какая длина жизненного цикла клиента?
  • Какой естественный период покупки?
  • Какая сезонность?
  • За какое время большинство клиентов успевает совершить повторную покупку?

Действенность RFM-анализа совсем не означает, что он может полностью заменить менеджера по продажам. Личное общение с заказчиком позволяет сотруднику хорошо понимать его и многое знать о нем. Правильно будет сосредоточить внимание менеджера на ключевых клиентах, а с остальными вести работу по электронной почте, с помощью сообщений и социальных сетей. RFM-анализ в этом случае становится отличным инструментом, помогающим провести сегментацию покупателей.

Все клиенты, от «транжир» до «почти потерянных покупателей» имеют различные потребности и желания, и, соответственно, по-разному реагируют на маркетинговые кампании.

Сегментация клиентов с помощью RFM-анализа

Для выполнения RFM-анализа сначала следует разделить клиентов на четыре равные группы, согласно распределению значений давности, частоты и величины покупок.

Четыре равные группы (квартили) с тремя переменными образуют 64 (4x4x4) клиентских сегмента, с такими цифрами вполне можно работать.

Заметьте, что вы можете использовать квинтили (пять равных групп) для лучшей детализации, однако, работа с 125 сегментами (5x5x5) может показаться непростой задачей.

Давность (R)

Частота (F)

Деньги (M)

Квартиль 1 (R=1)

Квартиль 1 (F=1)

Квартиль 1 (M=1)

Квартиль 2 (R=2)

Квартиль 2 (F=2)

Квартиль 2 (M=2)

Квартиль 3 (R=3)

Квартиль 3 (F=3)

Квартиль 3 (M=3)

Квартиль 4 (R=4)

Квартиль 4 (F=4)

Квартиль 4 (M=4)

Например, есть один клиент, и он:

Данный клиент принадлежит RFM-сегменту 1-1-1 (Лучшие клиенты), (R=1, F=1, M=1).

Вот самые важные RFM-сегменты:

Сегмент

RFM

Описание

Маркетинговая деятельность

Лучшие клиенты

1-1-1

Клиенты, совершившие последние покупки, делающие это чаще остальных, и тратящие денег больше остальных

Без ценовых стимулов, новые продукты и программа скидок для постоянных клиентов

Лояльные клиенты

X-1-X

Клиенты, совершившие последние покупки

Изучите их R и M для дальнейшей сегментации

Транжиры

X-X-1

Клиенты, тратящие больше остальных

Продвиньте самые дорогие продукты

Почти потерянные клиенты

3-1-1

Не совершали покупки некоторое время, но покупали часто и тратили больше остальных

Агрессивные ценовые стимулы

Потерянные клиенты

4-1-1

Не совершали покупки давно, но покупали часто и тратили больше остальных

Агрессивные ценовые стимулы

Потерянные экономные клиенты

4-4-4

Не совершали покупки давно, покупали мало и тратили меньше остальных

Не прикладывайте много усилий к их возвращению

Как провести RFM-анализ

Чтобы провести RFM-анализ, вам понадобятся данные о всех покупках, совершенных всеми клиентами. Это должен быть файл с информацией, обычно экспортируемый из вашего бухгалтерского ПО или транзакционной базы данных.

Шаг 1. Скачайте скрипты для RFM-анализа и файлы примеров с Githtub .

Шаг 2. Подготовьте файл CSV со всеми покупками или же используйте шаблон sample-orders.csv. Имена столбцов должны быть теми же.

order_date

order_id

customer

grand_total

2016-01-01

US-52653

john

2016-01-02

US-52654

mary

Шаг 3. Запустите скрипт RFM-analysis.py, находящийся в папке, куда вы поместили файл с данными. В скрипте есть три аргумента:

>python RFM-analysis.py -i sample-orders.csv -o rfm-segments.csv -d "2014-04-01"
  • Файл с данными (-i sample-orders.csv)
  • Файл для вывода данных с RFM-сегментацией (-o rfm-segments.csv)
  • Дата экспорта файла с данными (-d «YYYY-mm-dd”)

Это создаст RFM-сегменты в CSV-файле с названием rfm-segments.csv или иначе, а зависимости от того, что было задано вами с параметром -o.

Расшифровка результатов RFM-анализа

Клиент

Давность

Частота

Сумма

Сегмент RFM

Мария Н.

4 дня

58 покупок

$2 869

1-1-1

Владимир У.

50 дней

1 покупка

$44

3-4-4

Екатерина А.

47 дней

2 покупки

$156

3-2-1

  • Мария Н. принадлежит к сегменту «Лучшие покупатели», она совершала покупки совсем недавно (R=1), заказывает часто (F=1) и тратит много (M=1).
  • Владимир У. практически попал в сегмент «Потерянные экономные клиенты», он не покупал довольно давно (R=3), покупал немного (F=4) и потратил мало (M=4).
  • Екатерина А. относится к сегменту «Почти потерянные клиенты». Она не совершала покупки довольно давно (R=3), покупала довольно часто (F=2), но при этом она тратила очень много (M=1).

Эти простые шаги и есть сегментация клиентов. Теперь определите кого-нибудь прочесывать базу данных клиентов и выявлять наиболее важных для вашего бизнеса.

Или же создайте собственную настройку в , как ниже, чтобы визуализировать данные:

Выведите свой email-маркетинг на новый уровень путем RFM-сегментации

Теперь пришел черед email маркетинга. Ниже приводится пошаговый RFM-анализ:

1. Выберите RFM-сегмент, нужный вам (Лучшие клиенты, Почти потерянные клиенты, итд).
2. Решите как лучше всего поступить с данным RFM-сегментом
3. Определите задачу для данных email кампании и RFM-сегмента
4. Настройте отслеживание конверсии e-mail маркетинга
5. Создайте еще одну email версию, привзяанную к RFM-сегменту, нужному вам
6. Запустите кампанию по A/B-тестированию через email, когда контрольная группа получает обычную версию письма, а экспериментальная группа — письмо, выбранное согласно RFM-сегменту
7. Проанализируйте результаты и повторите — чаще то, что действует и реже то, что не действует

Заключение

RFM является относительно простой техникой, с чьей помощью возможно существенно улучшить вашу маркетинговую деятельность.

Обновляйте RFM-сегментацию путем автоматизирования процесса, например, с помощью скрипта RFM-анализа. Лучше всего обновлять данные каждый день.

Таким образом, клиентам, которые купили недавно, являются частыми покупателями и тратят много, назначается оценка 5 |5|5 . Они ваши лучшие клиенты.

В данном случае Александра является VIP – клиентом, а не Анна, которая потратила больше всех.

С другой стороны, клиенту, который потратил меньше всех, покупал давно и не часто присваивается оценка 1|1|1 . В данном случае это Николай. Теперь это имеет смысл, не так ли?

Как рассчитать оценку RFM по шкале 1-5?
Различные предприятия могут использовать разные методы для ранжирования значений RFM в масштабе от 1 до 5. Но вот два наиболее распространенных метода.

МЕТОД 1: Простые фиксированные диапазоны:

Пример:

Если кто-то купил в течение последних 24 часов, назначьте им оценку 5 .
За последние 3 дня - 4 . Назначьте 3 , если они купили в течение текущего месяца, 2 - за последние шесть месяцев и 1 - для всех остальных.

Как вы можете видеть, мы сами определили диапазон для каждого балла. Пороговые значения диапазона основаны на характере бизнеса. Таким же образом вы определяете диапазоны для частоты и денежных значений.

Этот метод оценки зависит от отдельных предприятий - поскольку они решают, какой диапазон они считают идеальным для периодичности, частотности и денежных значений.

При использовании данного метода расчета есть некоторые нюансы.
По мере роста бизнеса, диапазон баллов может потребовать частых корректировок.

МЕТОД 2: Процентное разделение на 5 равных значений на основе доступных данных.

Этот метод чуть сложнее, так как придётся работать с процентами, но в свою очередь он решает множество проблем, с которыми можно столкнуться при использовании первого метода. Данный подход работают с любой отраслью, поскольку диапазоны выбираются из самих данных и распределяются равномерно.
Конечно, мы рекомендуем использовать именно этот метод, поскольку сегментация будет более точной.

Сводка расчетов RFM :

Возьмите данные своего клиента, дайте оценку от 1 до 5 для R , F и M .
Графическое представление RFM поможет вам и другим лицам, принимающим решения, лучше понять RFM-анализ вашей организации.

R , F и M имеют оценки от 1 -5 , всего 5 x5 x5 = 125 комбинаций значений. Три измерения R , F и M могут быть наилучшим образом построены на трехмерной диаграмме. Если бы мы посмотрели, сколько клиентов у нас есть для каждого значения RFM , нам придется посмотреть 125 точек данных.

Но работа с 3D -графиками на бумаге или экране компьютера не сработает. Нам нужно что-то в двух измерениях, что-то легче изобразить и понять.

Упрощенное представление RFM-анализа:

В этом подходе мы используем частотность + денежный балл по оси X (диапазон от 0 до 10) и время последней покупки (диапазон от 0 до 5) по оси Y, Это уменьшает возможные комбинации со 125 до 50. Объединение F и M в один критерий имеет смысл, потому что оба значения связаны с тем, сколько клиент покупает. R (давность) на другой оси дает нам быстрый взгляд на уровни повторного взаимодействия с клиентом.

Повышение эффективности - создание сегментов.

Понимание 50-и элементов все еще может быть утомительным. Поэтому мы можем обобщить наш анализ на 11 сегментов, чтобы лучше понять наших клиентов.
Если вы помните, мы обсуждали эти сегменты в начале этой статьи.

Вот таблица, в которой объясняется, как вы можете создать 11 сегментов клиентов на основе оценок RFM .
Предоставление четкого цвета для каждого сегмента позволит легче запомнить клиентов и понять текущую ситуацию в бизнесе.

Вот наш окончательный сводный отчет RFM -анализа !

RFM сегментация состоит из трёх параметров:

Recency (R) - давность последней покупки

То есть, сколько времени прошло со времени взаимодействия c клиентом в днях, неделях или месяцах. Рассчитывается как разность между текущей и датой последнего заказа. Клиенты, которые недавно совершали у вас покупки, более предрасположены к повторным заказам, чем те, кто давно уже не проявлял никаких действий. Пользователей, которые покупали давно, можно возобновить только предложениями, которые привлекают вернуться обратно.

Frequency (F) - суммарная частота покупок

Показывает сколько взаимодействий (покупок) в течение определённого периода времени было у вас с клиентом. Если обе стороны остались довольны - есть шанс поддержать частоту покупок или увеличить в свою пользу. Чем больше клиент совершал покупок у вас, тем больше вероятность, что он их будет повторять и в будущем. Обычно, этот показатель тесно взаимосвязан с давностью покупки.

Monetary (M) - объём покупок

Как и предыдущие показатели, рассчитывается за определенный период или количество взаимодействий. Показывает какой была «стоимость клиентов» с точки зрения доходов и прибыльности, а точнее, сумма денег, которая была потрачена. Сгруппированные по денежным показателям анализы часто получают представление клиентов, чьи покупки отражают более высокую ценность для вашего бизнеса.

Все вышеуказанные показатели важно рассчитывать за период, который наиболее точно отобразит нужные данные. Допустим, можно взять выборку за один год и разделить её на кварталы.

Как правило, небольшой процент клиентов реагирует на общие рекламные предложения. RFM является отличным для прогнозирования реакции клиента и улучшения взаимодействия, а также повышение прибыли. RFM использует поведение покупателей, чтобы определить, как работать с каждой группой клиентов. Важность показателей ранжируется согласно последовательности букв – давность, частота, деньги. Иногда встречается название RF сегментация , когда показатель Monetary не используется, потому что его значение часто зависит от Frequency. Сегментация клиентской базы по такому принципу позволяет выделить тех с кем вам действительно надо работать, разделяя их на сегменты клиентов (активный, спящий, растущий), разрабатывая целевые маркетинговые предложения для наиболее активной группы клиентов.

Хотите провести RFM анализ контактной базы клиентов вашего бизнеса?

  • Мы свяжемся с вами, уточним, какие данные у вас есть и на их основе в течение недели подготовим документ с отчетом бесплатно.
  • Нам доверяют более 2 000 компаний, но чтобы вы были уверены в сохранности данных ваших клиентов, мы можем подписать договор о защите конфиденциальных данных.

Определение условий RFM

Определения «давность», «частота» и «деньги» понятны даже интуитивно, но наша задача, превратить их в цифры, которые можно использовать для оценки RFM, а это уже несколько сложнее.

Представим наши данные в виде таблицы, упорядоченной по первому значению - дате последней покупки (R).

Дата последней покупки (R)

Объём покупок (F)

Сумма покупок, грн

Средний чек, грн. (M)

Иван Петров

Петр Иванов

Олег Плющ

Сидор Петров

Оля Сидорова

Анна Волкова

Сразу же проставим по каждому показателю (R, F, M) «вес» для каждого клиента, исходя из полученных данных. Для оценки клиентской базы будем использовать числовые значения от 1 до 3, или же в процентном соотношении, назначенном каждому клиенту в результате анализа. Для удобства разделим всю клиентскую базу для начала на 5 равных частей по каждому из показателей. Допустим, из нашего примера по показателю «объём покупок» F - 1,2,3,4,5.

1 - наихудший для нас объём, пометим, как 1;

2,3,4 - средний результат, отметим его, как 2;

5 - самое лучшее значение F. Это наше 3.

Итак: 1 - это плохо, 2 - средний показатель и 3 - хороший. Проставив по каждому показателю «вес», чтобы с помощью этих весов ранжировать список.

Теперь мы можем легко определить, что для нас лучший клиент с результатами 333. 111 показывает, что клиент интересуется нами редко, возможно даже единоразово. Исходя из полученных результатов можно выбирать варианты, как поступать с той или иной группой клиентов.

Грустно то, что обычно 111 - самый большой сегмент. А радостно, что можно не тратить время на тех, кто уже потерян и сконцентрироваться на действительно важных для нас киентах.

Плюс RFM сегментации ещё и в том, что анализ можно делать даже по одному показателю, котрый вас наиболее интересует или комбинировать показатели, хотя полная сегментация клиентской базы даст вам гораздо больше возможностей. Допустим, возьмём за основу только давность и частоту, а получившиеся данные изобразим графически:

Зелёный сектор 5% - самые лучшие клиенты, которые активно на всё реагируют, покупают и т.д., соответственно сектор 1,1 - «мы их теряям». С каждым из сегментов таблицы нужно работать по-разному, предлагая им разные условия сотрудничества.

Мы всегда говорим, что хорошо видеть ситуацию в статике (как у нас дела сейчас), но еще важнее увидеть в динамике (куда мы движемся). Если рассчитать такую же таблицу за предыдущий период и «наложить» её на актуальную сегодняшнюю - можо увидеть, как изменяются данные:

В секторе 1,1 показатель упал на 6%, благодаря уменшению числа пассивных клиентов. Зато в секторе 3,3 число «хороших клиентов» увеличилось на 2%. Что же, значит мы работаем в нужном направлении. Надо проанализировать за счет чего это происходит и закрепить результат.

Этих данных уже достаточно для эффективной работы с клиентами, но если ещё к этому показателю добавить и сегмент денег, то работать над цифрами станет ещё интереснее:) RFM позволяет сегментировать базу так, чтобы вы тратили время и деньги на нужных клиентов. Попробуйте сделать сегментацию хотя бы по одному показателю и даже работа с этими данными может способствовать росту постоянных клиентов.

статья обновлена от даты 17.11.2013