Comparaison des performances selon des critères statistiques

Dans cette étude les données indiquant le comportement de réachat ont été scindés en deux. On a obtenu ainsi un ensemble d’entraînement ou d’estimation sur lequel les modèles ont été calibrés et un ensemble de validation des performances prédictives.

Tableau 8 - L’aire sous la courbe ROC (AUC) et les performances prédictives de plusieurs méthodes de ciblage

Echantillon

Effectifs

RNA
multiple

RNA

LOGIT

PROBIT

CART

estimation

24420

75,07%

74,92%

74,65%

74,62%

57,88%

validation

12210

73,98%

73,87%

73,78%

73,74%

57,07%

On observe que les modèles RNA s’ajustent légèrement mieux que les autres modèles. Les modèles logit et probit ont des performances comparables. La méthode CART enregistre les moins bons résultats. Les performances des RNA sur l’ensemble de validation ne sont pas significativement supérieures aux performances des modèles logit. Des analyses répétées effectuées sur de plus petits échantillons (4000 individus) montrent que les performances des RNA sont souvent légèrement inférieures à celles des modèles logit ou probit sur l’échantillon de validation, tout en restant supérieures sur l’échantillon d’estimation. On constate aussi que la qualité des modèles décroît avec les saisons car moins la campagne est récente moins il y a de données disponibles dans l’historique d’achat.

Michel CALCIU, Francis SALERNO; - Congrès AFM, Nancy 2005  - -