Présentation

La seule différence entre les modèles de réponse logit et probit réside dans la distribution du terme d'erreur qui suit une loi normale pour le modèle probit et une loi logistique pour le modèle probit.

Listing 3

  1. #Probit Regression
  2. dt<-brabant[samp,]
  3. attach(dt)
  4. formula<-if_cde97 ~ r6 + rr6 + f6m + m6m + mm6m + caa96 + cda96
  5. rfm.probit<-glm(formula,family=binomial(link=probit))
  6. par(mfrow=c(2,2))
  7. plot(rfm.probit)
  8. dt<-brabant[-samp,]
  9. attach(dt)
  10. predictv<-predict(rfm.probit, type="response", newdata=dt)
  11. names(predictv)<-1:length(predictv)
  12. gc<-gainchart(predictv,dt$if_cde97)
  13. par(mfrow=c(2,2))
  14. plot_gaincharts(gc)

Analyse:

La formule qui exprime la relation entre l'incidence de l'achat (if_cde97) et les variables rfm est utilisé pour calibrer le modèle probit dans le cadre de la procédure de régression linéaire généralisée (GLM). Le modèle probit est une option dans la famille des modèles binomiaux.

Pour verifier les performances predictives et economiques du modèle calibré sur deux tiers des clients on effectue les calculs prédictifs sur le tiers complémentair et on calcule le tableau des gains (gainchart).

Michel Calciu et Francis Salerno ; - Notes de cours à l'IAE de Lille 2004 - -