Marketing des bases de données – La segmentation RFM[1]

Marketing des bases de données – La segmentation RFM[1] M. Calciu – notes de cours  

Introduction

Introduction
La profitabilité du marketing des bases de données
La profitabilité du marketing des bases de données

Un des obstacles majeurs d’un marketing des bases de données efficace est l’absence de stratégies profitables pour l’utilisation des bases de données. L’obstacle n’est pas technique ou technologique car il y à pléthore de sociétés de services qui peuvent s’en charger. Par contre ce que ces intervenants externes normalement capables de faire, c’est de savoir comment rendre la base de données rentable.


Segmentation RFM
Segmentation RFM

Une des plus anciennes et toujours une des meilleures techniques est l’analyse RFM. En utilisant cette méthode, tout home de marketing qui dispose d’une grande base de données clients peut quasi garantir des promotions profitables envers la base de clients d’une période à une autre

Il y a des alternatives à l’analyse RFM  tel la modélisation basée sur des données socio-démographiques, analyse typologique, recherche marketing, interview de groupe ou enquête auprès des consommateurs. L’analyse RFM est préférée car tous les composants sont d’ordre comportemental, c à d quand est-ce que la personne a acheté la dernière fois, combien de fois a-t-elle acheté et combien d’argent a-t-elle dépensé. Ce sont des critères qui sont disponibles et peuvent être utilisés pour prédire le comportement du consommateur. La prévision du comportement n’a besoin d’aucun autre critère. L’analyse dans ce document montrera pourquoi c’est ainsi.


Codification d’une base de données pour la segmentation RFM

Codification d’une base de données pour la segmentation RFM
La disponibilité des données
La disponibilité des données

Pour effectuer l’analyse RFM, les fichiers client doivent contenir des données d’historique d’achat et utiliser un codage adapté. Cela suppose, que la base de données clients soit capable d’enregistrer en permanence la réponse du client. Cela est vrai pour les sociétés de téléphonie, pétrolières, de distribution en détail qui utilisent des cartes de fidélité propres, les vpc-istes, les assurances, le tourisme et le loisir, les banques et beaucoup d’autres.


Informations pour la RFM
Informations pour la RFM

Dans chaque enregistrement client il y a trois catégories d’information à maintenir:

- la date la plus récente quand le client a demandé un changement dans le service, a acheté un produit ou service etc.

- un compteur de la fréquence – le nombre de fois que le client a effectué un achat ou renouvelé un service avec la société. Pour une société de téléphone par exemple, ce serait le nombre de mois de service continu. Pour un magasin se serait le nombre de visites. Ce computer est incrémenté chaque fois qu’un achat est effectué.

- un compteur pour le montant dépensé – le montant total des sommes dépensées par le client avec la société.

En utilisant cette information des codes RFM seront construits.


Construire un code de récence

Construire un code de récence
Distribution des clients par rapport à la récence
Distribution des clients par rapport à la récence

Figure 1 - Simulation d'une BD clients en fonction de la récence – cadre générale


Vue sur la base de données
Vue sur la base de données

Figure 2 – Simulation d'une BD clients en fonction de la récence – Extraction d’un échantillon

…..


Tris de la base par rapport à la récence
Tris de la base par rapport à la récence

Pour créer un code de récence, tous les enregistrements de la base sont triés selon la date de la dernière commande, du plus récent au plus ancien.

Figure 3 – Simulation d'une BD clients en fonction de la récence – Tris de l’échantillon


Attribution de codes de récence aux clients
Attribution de codes de récence aux clients

L'échantillon est divisé en cinq parties égales (quintiles), le premier quintile reçoit le code 5 et le dernier le code 1.

Figure 4 – Simulation d'une BD clients en fonction de la récence – Codes de récence


La réponse des clients par rapport à la récence
La réponse des clients par rapport à la récence

Si une offre promotionnelle est envoyée, le résultat des réponses en fonction de la récence peut être résume de la manière suivante :

Figure 5 – Simulation d'une BD clients en fonction de la récence – Synthèse


Analyse
Analyse

Que faut-il faire ? On le sait en marketing qu’on trouve la plus grande probabilité de répondre à une campagne parmi les gens qui ont effectué un achat le plus récemment. Un client a plus de chances de réagir à une promotion s’il a eu récemment une transaction satisfaisante avec la société. Cela est vrai dans la distribution; l’informatique, l’automobile, les assurances. C’est un phénomène universel. Il peut être testé à très faible coût en lançant un programme pour insérer de codes de récences dans la base de données et ensuite lancer une promotion de routine, les réponses par la récence peuvent être vérifiées. 

 


Construire un code de fréquence

Construire un code de fréquence
Distribution des clients par rapport à la fréquence
Distribution des clients par rapport à la fréquence

Figure 6 - Simulation d'une BD clients en fonction de la fréquence – cadre générale

 


Vue sur la base de données
Vue sur la base de données

Figure 7 – Simulation d'une BD clients en fonction de la fréquence – Extraction d’un échantillon


Tris de la base par rapport à la fréquence
Tris de la base par rapport à la fréquence

Pour créer un code de fréquence, tous les enregistrements de la base sont triés selon la fréquence des commandes, du plus fréquent au moins fréquent.

 

Figure 8 – Simulation d'une BD clients en fonction de la fréquence – Tris de l’échantillon


 


Attribution de codes de fréquence aux clients
Attribution de codes de fréquence aux clients

L'échantillon est divisé en cinq parties égales (quintiles), le premier quintile reçoit le code 5 et le dernier le code 1.

Figure 9 – Simulation d'une BD clients en fonction de la fréquence – Codes de fréquence


La réponse des clients par rapport à la récence
La réponse des clients par rapport à la récence

Si une offre promotionnelle est envoyée, le résultat des réponses en fonction de la fréquence des commandes peut être résume de la manière suivante :

Figure 10 – Simulation d'une BD clients en fonction de la fréquence – Synthèse


Analyse
Analyse

Chaque quintile, donne lieu à un code fréquence code de 5, 4, 3, 2 ou 1. Dans l’enregistrement par client, le code de fréquence sera placé juste après le code de récence. Ainsi un code à deux chiffres vient d’être créé pour chaque client qui varie de 55 (le plus récent et le plus fréquent) à 11 (le plus ancien et le moins fréquent). Chaque groupe aura le même nombre d’enregistrements.

Lors de la prochaine promotion un graphique des réponses en fonction de la fréquence pourra être tracé. Il ressemblera au graphique présenté en Figure 10. On remarquera que la différence entre le premier et le second quintile pour la fréquence n’est pas aussi grand que celle des quintiles de récence. C’est parce-que la récence est un prédicteur plus fort de la réponse du client que la fréquence.


Construire un code de montant

Construire un code de montant
Distribution des clients par rapport au montant de la commande
Distribution des clients par rapport au montant de la commande

Figure 11 - Simulation d'une BD clients en fonction du montant – cadre générale

 


Vue sur la base de données
Vue sur la base de données

Figure 12 – Simulation d'une BD clients en fonction du montant – Extraction d’un échantillon

 


Tris de la base par rapport au montant
Tris de la base par rapport au montant

Pour créer un code de montant, tous les enregistrements de la base sont triés selon le montant des commandes, du plus grand au plus petit.

Figure 13 – Simulation d'une BD clients en fonction du montant – Tris de l’échantillon


Attribution de codes de fréquence aux clients
Attribution de codes de fréquence aux clients

L'échantillon est divisé en cinq parties égales (quintiles), le premier quintile reçoit le code 5 et le dernier le code 1.

Figure 14 – Simulation d'une BD clients en fonction du montant – Codes de montant


La réponse des clients par rapport à la récence
La réponse des clients par rapport à la récence

Si une offre promotionnelle est envoyée, le résultat des réponses en fonction du montant des commandes peut être résume de la manière suivante :

Figure 15 – Simulation d'une BD clients en fonction du montant  – Synthèse

 

Dans l’enregistrement par client, le code de fréquence sera placé juste après le code de fréquence. Ainsi un code à trois chiffres sera créé pour chaque client qui varie de 555  à 111.  Il y aura 125 cellules RFM avec le même nombre d’enregistrements chacune.

Ceux-ci devraient être recalculés et révisés à chaque fois que la base de données est actualisée – typiquement une fois par mois.

De l’espace devrait être créé dans le fichier client pour enregistrer les cellules RFM précédentes pour savoir comment les gens ont évolué durant le mois précédent – il est possible de garder la trace des cellules RFM sur plusieurs périodes, six mois par exemple.

La puissance de ces codes peut être démontrée maintenant à l’aide d’un exemple concernant un test.


La pratique de la segmentation RFM

La pratique de la segmentation RFM
Un mailing test
Un mailing test

La puissance des codes RFM peut maintenant être illustrée à l’aide d’un exemple : une action de promotion test envers 40000 clients.

D’abord il faut choisir les 40000 clients de la base de données. On utilise un tirage systématique qui permet de sélectionner les enregistrements de la population de la base avec un ratio N. Pour déterminer un ratio égale à 20, on divise le nombre total de clients dans la base 800000 par la taille de l’échantillon désiré 40000. Chaque 20-ième enregistrement sera sélectionné, le 1-er, le 21-ème, le 41-ème etc.

Les 40000 clients sélectionnés pour le test forment un échantillon représentatif de la base des clients indépendamment de l’ordre dans lequel la base avait été triée (alphabétique, code postal, numéro du client etc.). L’échantillon sera représentatif pour les codes RFM aussi. Il y aura 125 cellules RFM différentes et chacune comportera le même nombre de clients.

Figure 16 – Simulation d’un mailing test


Les réponses par segment RFM
Les réponses par segment RFM

Dans cet exemple l’offre faite aux 40000 clients concerne un produit qui coûte approximativement 3120€ et le profit variable d’une vente réussie est de 335€.

Tableau 1 - Réponses à un mailing test envers 40.000 adresses

Position
cellule

Cellule
RFM

No.
envois

No.
réponses

Taux de
réponse

A

B

C

D

E

1

555

320

31

9,69%

2

554

320

30

9,38%

3

553

320

28

8,75%

4

552

320

20

6,25%

5

551

320

19

5,94%

6

545

320

26

8,13%

7

544

320

20

6,25%

8

543

320

18

5,63%

9

542

320

16

5,00%

10

541

320

12

3,75%

11

535

320

14

4,38%

12

534

320

10

3,13%

13

533

320

10

3,13%

14

532

320

9

2,81%

15

531

320

7

2,19%

16

525

320

13

4,06%

17

524

320

10

3,13%

18

523

320

8

2,50%

19

522

320

8

2,50%

20

521

320

7

2,19%

Le coût du mailing (qui inclut la création, impression, la personnalisation et le postage) est de $0.62 par pièce. La réponse à cette offre peut ressembler à ce qui est affiché dans le Tableau 1.

Ce sont seulement les premières 20 cellules. Il y a 125 au total. Les cellules inférieures ont en général des taux de réponse plus faibles. Celles qui sont vers les bas n’ont pas de réponse du tout. (Toutes les cellules ont exactement la même taille à cause de la méthode avec laquelle elles ont été crées. Chaque quintile (R, F, et M) représente exactement 20 pour-cent du fichier. Il résulte que chacune des 125 cellules aura exactement 5 pour-cent de l’ensemble du fichier. (Si le codage a été fait correctement, il n’y aurait pas des cellules plus grandes ou plus petites).


Résultats
Résultats

Tableau 2: campagne test utilisant un fichier de clients de la distribution en détail

 

Nombre

Revenu/indiv.

Rev/Operation

Nombre de clients contactés

40,000

0.62

24800

Nombre répondants

711

35.00

24.885

Taux de Réponse

1,78%

 

 

Profit net de l'opération

$85

 

 

Les résultats de cette promotion test peuvent ressembler à ceux du Tableau 2, qui sont extraits d’un fichier de clients de magasin en détail ou le produit communiqué en promotion était des vêtements d’homme et de femme vendus à un prix de $125.


Discussion
Discussion

La plus part des gens considéreraient cette promotion comme un échec. Approximativement $25,000 ont été dépensés pour un mailing qui a apporté un profit de seulement $85 après avoir couvert toutes les dépenses. Cela ne couvre pas le temps dépensé pour planifier l’action de promotion, même si ça couvre les coûts de mailing. Cette promotion sans succès est d’une grande utilité, car c’est une source d’apprentissage  des taux de réponse pour chaque cellule RFM. Cela a une grande valeur.

La théorie derrière l’analyse RFM est que le meilleur prédicteur du comportement futur est le comportement passé et présent. Il est certainement meilleur que les données socio-démographiques ou géographiques. Comme les cellules RFM sélectionnées pour le test sont identiques à celles de la base entière, on peut supposer que ces clients pas encore démarches répondrons de la même manière s’ils reçoivent la même offre. Comme on sait si une cellule donnée répond ou pas, la promotion envers les cellules non profitables peut être évitée et l’attention sera accordée aux cellules profitables.


Determiner les cases RFM profitables

Determiner les cases RFM profitables
Trouver le point d’équilibre
Trouver le point d’équilibre

Les cellules profitables sont celles dont le taux de réponse est supérieur au point mort. Il existe une formule simple pour calculer le point mort:

Point d’équilibre = coût unit. mailing / revenu net d'une vente

Dans l'exemple le coût d'un mailing était de $0. ,62 et le revenu obtenu d'une vente était $35.

Par conséquent le taux de réponse d'équilibre est:

 $0,62/$35 = 1,77 %

 

Figure 17: Profitabilité des cellules RFM suite à un mailing test (40000 adresses)


Eliminer les cases en dessous du point d’équilibre
Eliminer les cases en dessous du point d’équilibre

Toute cellule RFM qui à un taux de réponse prévu de 1,77 pour-cent ou plus devrait être approché. Le reste doit être abandonné. Une représentation graphique des cellules profitables et non-profitables est présentée dans la Figure 16.

Les données pour ce graphique ont été prépares en divisant le taux de réponse par le taux du point mort, en multipliant par  100 et soustrayant 100. Les taux du point mort apparaissent pour cette raison égales à zéro. Il s’agit d’un index de profitabilité. Toute cellule ayant un score supérieur à zéro sera profitable, pendant que celles qui se trouvent en dessous seront non profitables.

En connaissant la profitabilité prévue, il est facile de faire du profit d’une campagne de promotion: il faut envoyer uniquement aux cellules profitables.


Etape préliminaire – déflater les résultats du test
Etape préliminaire – déflater les résultats du test

Il est bien connu que le mailing test donne souvent des résultats supérieurs à ce qu'on obtiendra sur l'ensemble de la base de données clients. L'exemple illustre cette situation et propose des calculs de rentabilité comparatifs.

Figure 18 – Simulation et profitabilité d’une opération de marketing direct


Calculs
Calculs

Tableau 3 – Calculs comparatifs de profitabilité

 

Test

Liste clients

Liste sélectée

Mailings

40000

800000

211200

Réponses

711

12104

7293

Taux de réponse

1.78%

1.51%

3.45%

Coût de mailing

24800

496000

130944

Revenue net

24885

423640

255255

Profit net

$85

($72360)

$124311

 

Il y a quant même un pas préliminaire, qui va assurer le succès – les résultats du test doivent être déflatés. C’est une chose bien connue en marketing direct marketing que le test donne de résultats meilleurs que la vraie campagne. Ce ci signifie que si le taux de réponse de 2 pour-cent au test, il y a sûrement  2 pour-cent de moins quand le fichier en entier sera envoyé. Une explication plausible est que les marketeurs ne supportent pas d’avoir des tests sans succès. Ils feront toujours quelque chose pour que le test ait un bon taux de réponse. Ils supposent que si leur test ne fonctionne pas, leur réputation peut en souffrit, donc ils sélectionnent les meilleures listes clients, les meilleurs moments dans l’année, les meilleures offres – dans beaucoup de cas il s’agit de choses qu’on ne peut pas répliquer durant une vraie campagne de promotion.

Dans ce cas,  la liste ne peut pas être trafiquée même si un N-ième à été utilise. En tous cas il y a des choses subtiles qui déforment les résultats du test. Pour cette raison, il est recommandé de déflater les résultats du test de 15% pour déterminer les réponses de cellules RFM dans la campagne. 25% ou un autre nombre peut être utilisé. Cela signifie que s’il y a eu un taux de réponse de 2 pour-cent dans une cellule RFM on devrait considérer qu’en réalité il y aura seulement 1,7 pour-cent (2 x 0,85) taux de réponse pour la même cellule à l’occasion d’un mailing plus ample.


Utiliser les taux de réponses déflatés
Utiliser les taux de réponses déflatés

En utilisant ces taux de réponse déflatés, seulement les cellules qui dépassent le point mort devraient être prises en compte. Les résultats peuvent être étonnants, comme dans le tableau 3. Le tableau 3 montre que si la campagne est menée sur l’ensemble de la base, le taux de réponse  aura été de 1.15 pour-cent (c à d 85 pour-cent du taux du test 1.78 pour-cent). 12.104 commandes auraient été passées  avec un profit net $35 par commande. Cela aurait apporté un revenu de $423,640. Mais la campagne totale aurait donné une perte de 572,360, après avoir déduit les coûts de mailing de 8496,000.

En utilisant les résultats du test déflaté, il y a seulement 211,200 clients qui se trouvent dans des cellules RFM profitables dont le taux de réponse déflaté est supérieur à 1.77 pour-cent ou supérieur. Le taux de réponse déflaté est obtenu en baissant les résultats du test pour chaque cellule RFM de 15 pour-cent. En adressant seulement ces 211200, on obtient seulement 7293 commande pour un revenu net de $255,255. Comme les coûts de mailing sont de seulement $130,944, le profit net du projet est de $124,311.

Ce n’est pas une coïncidence mais de l’analyse RFM normale. Elle va toujours fonctionner si des bonnes données existent pour construire de cellules RFM valables et si les méthodes sont suivies avec rigueur. Presque tout test valable peut être transformé dans une campagne de marketing direct profitable.


Compléments

Compléments
Dimensions de l’échantillon test
Dimensions de l’échantillon test

Une question qui se pose est quelle doit être la taille de l’échantillon de test pour être valable. Une règle de base est que le nombre de  réponses attendues soit supérieur ou égal à 500. Pour connaître cette taille il est nécessaire d’avoir une idée sur le taux de réponse attendu. S’il devait y avoir normalement un taux de 5 pour-cent de la part des clients, alors pour produire 500 réponses, seulement 10000 clients doivent être testés.

Le nombre de réponses attendu devrait être de 500 ou plus care il y a 125 cellules RFM; 500 signifie que la cellule RFM moyenne aura quatre répondants (500/125) . Quand la cellule moyenne et inférieure à quatre, la chance devient plus importante que le comportement du consommateur. Bien-sur, plus le test est grand, plus les résultats sont précis. Un test de 40000 sera plus précis qu’un test de 30000. Le coût sera évidement plus grand. Est-ce que le coût supplémentaire de 10000 est justifié pour un plus de précision dans la sélection des adresses pour la campagne? Cette décision devra être faite en fonction des situations particulières de chaque société et les expériences doivent être répétées pour trouver la taille idéale du test pour la base de données clients.


Quelques exceptions
Quelques exceptions

Comme on peut le voir de l’analyse, RFM fonctionne seulement avec des bases de données clients et seulement avec des bases qui contiennent les données nécessaires. Elle ne peut pas être utilise avec la base des prospects. Si une base de données clients n’a qu’une  partie des données nécessaires (par exemple la récence et la fréquence, mais ne dispose pas de montants dépensés par commande) on peut toujours tirer profit en essayant la technique.

Déterminer la récence peut poser des problèmes. Pour la distribution d’électricité, la société de téléphone, la presse ou les sociétés d’assurance, par exemple, les clients reçoivent souvent des reçus mensuels et ont à payer leurs factures tous les mois. Si la dernière facture payée était utilisée comme récence, chaque client aurait la récence un, ce qui ne serait pas d’une grande utilité. Dans de telles situations, on peut prendre comme la date la plus récente, la dernière fois quand les clients ont changé leur service ou la dernière fois quand ils ont appelé le service clientèle ou une autre date similaire. L’idée est de trouver la dernière date quand ils ont pensé à l’entreprise et ont fait quelque chose. A de tells moments, l’entreprise a été évoquée dans leur mémoire consciente.


Personnalité des cases RFM
Personnalité des cases RFM

La méthode RFM a été illustrée en considérant que la campagne allait se dérouler par voie postale ou par télémarketing. Il y a nombreuses autres utilisations. Si par exemple il est décidé de créer des segments de clients spéciaux, qui recevront un traitement spécial (détenteurs de cartes “gold”, par exemple), RFM est une méthode idéale pour trouver ceux qui iront dans la plus haute catégorie.

Chaque cellule RFM a sa propre personnalité. Tous les nouveaux clients entrent comme des 511. Ils sont les plus récents, mais d’habitude ils sont les moins fréquents et ont les plus faibles montants. Après leur entrée ils peuvent évoluer vers le haut ou vers le bas, en fonction de leur comportement ultérieur. Il convient d’enregistrer où se trouvent les gens Durant le dernier mois. On peut fixer des objectifs à atteindre pour chaque cellule, d’amener les nouveaux clients à avancer dans leur deuxième mois de 511 à 512, par exemple, au lieu de tomber vers 411.

Ce du groupe le plus bas peuvent ne pas être des clients du tout. Ceux ci pourraient être archives, par extraction de la base de données, après avoir essayé de les réactiver par un mailing. Les garder dans la base anée après année peut simplement gaspiller l’argent de l’entreprise. Les 155s ne devraient pas être purges sans des efforts de réactivation préalable, on doit leur accorder une attention toute particulière.


Maintenir le contact
Maintenir le contact

Si les cellules RFM sont utilisées comme bas pour le contact de l’entreprise avec ses clients, le contact avec certains clients pourra être perdu pour de bon – ceux qui se trouvent en dessous du point mort dans les tests. Cela peut aussi bien être bien ou mal. De toute manière l’objectif de construction d’une relation avec les clients est lié à la possibilité de construire des profits. Quatre-vingt pour-cent des revenues de l’entreprise viennent d’habitude des premiers 20 pour-cent – ceux qui sont dans 5 au niveau du montant. La discrimination est utile pour l’entreprise et en même temps bien acceptée pare les clients. Bien venue car certaines personnes ne veulent pas être embêtées par leurs fournisseurs tout le temps. Un 111 essaye peut-être de dire “Laissez mois tranquille, s’il vous plait”. Les deux parties gagnent de la séparation.


Influencer le comportement
Influencer le comportement

Est-ce que l’analyse RFM influence le comportement du consommateur? Pas vraiment. RFM est simplement utilisé comme méthode de segmentation de la base des clients à partir du comportement passé et en l’utilisant on arrive à prédire les comportements futurs. Le comportement du client est plus influencé par la communication qui est faite dans les catalogues etc.


Marketing des bases de données – La segmentation RFM... 1

M. Calciu – notes de cours. 1

Introduction. 1

Codification d’une base de données pour la segmentation RFM... 1

Construire un code de récence. 2

Construire un code de fréquence. 4

Construire un code de montant 6

La pratique de la segmentation RFM... 9

Determiner les cases RFM profitables. 11

Compléments. 13

Ressources. 16



Ressources

Ressources
Exemples sur tableur: Initiation aux bases de données et au marketing direct
Exemples sur tableur: Initiation aux bases de données et au marketing direct