Choix binaire et critères statistiques

Les résultats obtenus au niveau des modèles de choix binaire (incidence de l’achat) sont en  accord avec deux autres études récentes (Potharts et al 2001 ; Madeira et Sousa, 2002) réalisées à partir des mêmes catégories de variables dans des contextes de collecte de fonds. Potharts et al (2001) comparaient les RNA à la méthode CHAID et à la régression logistique et trouvaient que les RNA avaient des performances prédictives au moins égales à celles des autres modèles. Madeira S. et Sousa J. M. (2002) confrontaient  quatre méthodes de sélection de cibles en marketing direct : la régression logistique, les RNA, les arbres de classification et la modélisation fuzzy et montraient que les RNA étaient plus performants que la régression logistique ou que le modèle CART. Les méthodes comparées se valent dans le contexte étudié ici. Les RNA s’ajustent en général mieux sur l’échantillon d’estimation (d’apprentissage) que les autres méthodes mais ils perdent cet avantage sur l’échantillon de validation. Il y a sur-apprentissage, les RNA arrivent à capter des phénomènes spécifiques à chaque échantillon et donc non généralisables aux autres. Des historiques d’achat plus longs ont un effet positif sur la qualité des prédictions.

Michel CALCIU, Francis SALERNO; - Congrès AFM, Nancy 2005  - -