Gainchart des modèles d'incidence de l'achat
Les critères de performance économique utilisés en complément aux critères purement statistiques nous permettront d’étendre la comparaison des performances prédictives au-delà des modèles d’incidence de l’achat analysés jusqu’ici vers des modèles de choix polytomique et continu.
Pour vérifier les performances économiques des modèles nous allons suivre la démarche utilisée par Levin et Zahavi (1998). Elle suppose le calcul de tableaux des gains (gainchart) pour chaque modèle. Ces tableaux présentent le résultat des estimations, appliquées à l'échantillon validation, dans l'ordre décroissant des réponses par décile.
A titre d’illustration le tableau des gains du modèle logit est présenté.
Tableau 9 – Tableau des gains d’un modèle de choix binaire (le modèle logit)
Déciles |
Réponses réelles |
Rentabilité |
Réponses prédites |
|||||
lim. inf. |
Cum. |
Décile |
cum. |
Prc. |
Profit |
Cum. |
décile |
Cum. |
(1) |
(2) |
(3) |
(4) |
(5) |
(6) |
(7) |
(8) |
(9) |
55,9% |
1221 |
816 |
816 |
23,9% |
20897 |
20897 |
802 |
802 |
42,5% |
2442 |
583 |
1399 |
41,0% |
11444 |
32341 |
604 |
1406 |
39,5% |
3663 |
514 |
1913 |
56,1% |
8644 |
40985 |
506 |
1912 |
34,1% |
4884 |
347 |
2260 |
66,3% |
1869 |
42854 |
426 |
2338 |
22,6% |
6105 |
305 |
2565 |
75,2% |
165 |
43019 |
336 |
2674 |
14,6% |
7326 |
250 |
2815 |
82,5% |
-2067 |
40952 |
251 |
2925 |
11,1% |
8547 |
143 |
2958 |
86,7% |
-6408 |
34544 |
146 |
3071 |
11,0% |
9768 |
148 |
3106 |
91,1% |
-6205 |
28339 |
135 |
3206 |
11,0% |
10989 |
161 |
3267 |
95,8% |
-5678 |
22661 |
135 |
3340 |
9,8% |
12210 |
144 |
3411 |
100,0% |
-6368 |
16293 |
133 |
3474 |
La probabilité dans la colonne 1 représente la limite inférieure de chaque décile ou autrement dit l'équivalent de la probabilité d'achat du dernier individu dans chaque décile. Le tableau donne aussi le profit évalué au niveau de chaque décile. Il est calculé en multipliant le nombre de répondants dans le décile avec le revenu moyen par commande, qui lui est égale à la marge fixée à 10% et multipliée au prix moyen de 405,7F et en déduisant les coûts de mailing (ici 10F). Le taux de réponse d'équilibre est égale ici a 10/(0,1*405.7)= 24,6%. Dans ces conditions il convient d'envoyer les mailings aux premiers 5 déciles ou à 6105 clients qui récupèrent 2565 réponses ou 75,2% des achats (3411) et un profit cumulé de 43019F.
La qualité de la prédiction du modèle logistique est exprimée par le pourcentage des acheteurs qui décline ici fortement avec les déciles, de 816 dans le premier décile à 144 dans le dernier décile. Comme dans Levin et Zahavi (1998, p.10) on peut montrer que le nombre prédit de répondants dans quasi chaque décile se trouve dans les limites de l'intervalle de confiance de 95%[5]. Ce constat est valable pour tous les modèles comparés dans ce papier.