Presentation
Conceptuellement, l'analyse discriminante s'éloigne assez fortement des méthodes précédentes car elle tente de trouver une fonction assurant la meilleure discrimination entre répondants et non-répondants. Elle présente l'avantage d'offrir des repères capables d'indiquer si les sujets sont mal classés. En même temps, c'est une technique très sensible aux violations des présomptions de normalité pour des taux de réponses inférieurs à 10% (Shepard, 1995), très fréquents en marketing direct.
Listing 4
- # Linear discriminant analysis
- library(MASS)
- dt<-brabant[samp,]
- attach(dt)
- formula<-if_cde97 ~ r6 + rr6 + f6m + m6m + mm6m + caa96 + cda96
- rfm.lda<-lda(formula)
- dt<-brabant[-samp,]
- attach(dt)
- predictv<-pnorm(predict(rfm.lda, newdata=dt)$x)[,1]
- names(predictv)<-1:length(predictv)
- gc<-gainchart(predictv,if_cde97)
- par(mfrow=c(2,2))
- plot_gaincharts(gc)
Analyse:
La formule qui exprime la relation entre l'incidence de l'achat (if_cde97) et les variables rfm est utilisé pour calibrer la fonction discriminante dans le cadre de la procédure d'analyse discriminante linéaire (lda).
Pour verifier les performances predictives et economiques du modèle calibré sur deux tiers des clients on effectue les calculs prédictifs sur le tiers complémentair et on calcule le tableau des gains (gainchart). Le score de chaque individu sur l'axe discriminant a été transformés en probabilités