Présentation

La grande variété des méthodes de ciblage utilisées exige un choix de mesures de performances suffisamment génériques pour permettre des comparaisons. Toutes les méthodes de ciblage évoquées parviennent à classer les clients dans l’ordre de leur probabilité d’achat ou de réachat estimée. En fait elles calculent pour chaque individu un score qui peut être une probabilité « a posteriori » dans le cas du modèle logit ou probit, ou une autre mesure comme par exemple le logit, ou l’écart entre la probabilité moyenne et la probabilité qui caractérise une cellule comme dans le cas d’une méthode RFM classique.

Lorsqu’une valeur de séparation absolue est choisie (cutoff), tous les clients ayant un score inférieur sont classés non-acheteur ; ceux ayant un score supérieur sont classés acheteur. Le résultat de la classification peut être résumé par une matrice des confusions (Morrison, 1969).

Tableau 7 - La matrice de confusion

		Etat réel
		Acheteur	Non acheteur
Etat prédit	Acheteur	vrais positifs (VP)	faux positifs (FP)
Etat prédit	Non acheteur	faux négatifs (FN)	vrais négatifs (VN)

Dans de tels problèmes de classification binaire deux types d’erreurs peuvent être distingués (tableau 7). Les statisticiens appelleraient erreur de type 1, la catégorie faux positif, qui correspond ici au fait de classer les non-acheteurs comme acheteurs et erreur de type 2, la catégorie faux négatif le faite de classer des acheteurs comme non-acheteurs. Plusieurs mesures peuvent être tirées de la matrice de confusion (Bradley, 1997):