Le modèle logistique - estimation

les modèles logistiques de type probit ou logit ont l'avantage d'être bien adaptés aux problèmes de décision binaire (achat/non-achat) et d'éviter les désavantages du modèle linéaire de probabilité. Ils sont fréquemment utilisés dans le marketing des bases de données ("database marketing"). Ils supposent l'existence d'une variable latente qui mesure la propension de répondre. Elle dépend d'une série de caractéristiques individuelles représentées dans ce contexte par les variables RFM. Par rapport aux RNA, ces modèles ont l'avantage d'être faciles à interpréter et ils sont connus pour être robustes et donner de bons résultats dans les études comparatives. 

Listing 2

  1. #Logit Regression
  2. dt<-brabant[samp,]
  3. attach(dt)
  4. formula<-if_cde97 ~ r6 + rr6 + f6m + m6m + mm6m + caa96 + cda96
  5. rfm.logit<-glm(formula,family=binomial)
  6. par(mfrow=c(2,2))
  7. plot(rfm.logit)
  8. summary(rfm.logit)
  9. dt<-brabant[-samp,]
  10. attach(dt)
  11. predictv<-predict(rfm.logit, type="response", newdata=dt)
  12. names(predictv)<-1:length(predictv)
  13. gc<-gainchart(predictv,dt$if_cde97)
  14. par(mfrow=c(2,2))
  15. plot_gaincharts(gc)

Analyse:

La formule qui exprime la relation entre l'incidence de l'achat (if_cde97) et les variables rfm est utilisé pour calibrer le modèle logit dans le cadre de la procédure de régression linéaire généralisée (GLM). Le modèle logit est la variante par default dans la famille des modèles binomiaux.

Pour verifier les performances predictives et economiques du modèle calibré sur deux tiers des clients on effectue les calculs prédictifs sur le tiers complémentair et on calcule le tableau des gains (gainchart).

Michel Calciu et Francis Salerno ; - Notes de cours à l'IAE de Lille 2004 - -