Notes
[1] Selon Bauer (1988), Cullinan (1977), est le premier à avoir signalé que la récence, la fréquence et la valeur monétaire des achats (RFM) étaient les variables les plus souvent utilisées dans les modèles de database marketing. Depuis, de nombreuses études (tableau 1) ont montré que ces variables constituent le groupe de prédicteurs le plus important pour modéliser l’achat par correspondance. Van den Poel (2003) trouve ainsi que les variables RFM (242 opérationnalisations différentes sont analysées) sont, de loin, les plus importants déterminants du réachat. A elles seules, elles arrivent a couvrir plus de 50% de la « place maximum d’amélioration » (entre les modèle aléatoire et le modèle idéal) et les autres variables n’arrivent qu’à apporter 3,8% d’amélioration additionnelle.
[2] Le système S est un langage de très haut niveau et un environnement d’analyse des données et graphiques. C’est le seul système statistique à avoir reçu le prestigieux Software System Award (1998) de la Association for Computing Machinery (ACM) qui lui reconnaît le mérite d’avoir «définitivement changé la manière dans laquelle les gens analysent, visualisent et manipulent les données». La flexibilité de ce système est telle que même pour le traitement de petits ensembles de données le tableur devient vite un outil encombrant et son rôle ce réduit à celui d’une simple interface pour présenter les résultats des traitements effectués avec R dans un environnement plus familier pour des néophytes. Toutes les analyses de cette recherche ont été réalisées avec le système R. Pour la présentation de certains résultats on a fait appel à l’interface R-(D) COM pour Windows qui permet de connecter des applications client comme Excel avec R.
[3] Une discussion détaillée sur CART peut être trouvée dans Haughton et Oulabi (1993) et dans Thrasher (1991).
[4] Green et Swets (1966) et Swets (1979), pour plus de détails sur cette courbe.