Comparaison des performances selon des critères statistiques

Dans cette étude les données indiquant le comportement de réachat ont été scindés en deux. On a obtenu ainsi un ensemble d’entraînement ou d’estimation sur lequel les modèles ont été calibrés et un ensemble de validation des performances prédictives.

Tableau 8 - L’aire sous la courbe ROC (AUC) et les performances prédictives de plusieurs méthodes de ciblage

Echantillon	Effectifs	RNA multiple	RNA	LOGIT	PROBIT	CART
estimation	24420	75,07%	74,92%	74,65%	74,62%	57,88%
validation	12210	73,98%	73,87%	73,78%	73,74%	57,07%

On observe que les modèles RNA s’ajustent légèrement mieux que les autres modèles. Les modèles logit et probit ont des performances comparables. La méthode CART enregistre les moins bons résultats. Les performances des RNA sur l’ensemble de validation ne sont pas significativement supérieures aux performances des modèles logit. Des analyses répétées effectuées sur de plus petits échantillons (4000 individus) montrent que les performances des RNA sont souvent légèrement inférieures à celles des modèles logit ou probit sur l’échantillon de validation, tout en restant supérieures sur l’échantillon d’estimation. On constate aussi que la qualité des modèles décroît avec les saisons car moins la campagne est récente moins il y a de données disponibles dans l’historique d’achat.