Présentation
La grande variété des méthodes de ciblage utilisées exige un choix de mesures de performances suffisamment génériques pour permettre des comparaisons. Toutes les méthodes de ciblage évoquées parviennent à classer les clients dans l’ordre de leur probabilité d’achat ou de réachat estimée. En fait elles calculent pour chaque individu un score qui peut être une probabilité « a posteriori » dans le cas du modèle logit ou probit, ou une autre mesure comme par exemple le logit, ou l’écart entre la probabilité moyenne et la probabilité qui caractérise une cellule comme dans le cas d’une méthode RFM classique.
Lorsqu’une valeur de séparation absolue est choisie (cutoff), tous les clients ayant un score inférieur sont classés non-acheteur ; ceux ayant un score supérieur sont classés acheteur. Le résultat de la classification peut être résumé par une matrice des confusions (Morrison, 1969).
Tableau 7 - La matrice de confusion
Etat réel |
|||
Acheteur |
Non acheteur |
||
Etat prédit |
Acheteur |
vrais |
faux |
Non acheteur |
faux |
vrais |
Dans de tels problèmes de classification binaire deux types d’erreurs peuvent être distingués (tableau 7). Les statisticiens appelleraient erreur de type 1, la catégorie faux positif, qui correspond ici au fait de classer les non-acheteurs comme acheteurs et erreur de type 2, la catégorie faux négatif le faite de classer des acheteurs comme non-acheteurs. Plusieurs mesures peuvent être tirées de la matrice de confusion (Bradley, 1997):