Presentation

C'est la méthode la plus facile à mettre en place pour estimer de modèle de choix continu car largement disponible sur une gamme large de machines (des calculettes aux ordinateurs) et de logiciels accessibles, comme par exemple les tableurs.

Malgré la disponibilité elle n'est pas bien adaptée pour des modèles de choix continu . Les estimations qu'elle fournit ne sont pas bornés par de seuils inférieurs et supérieurs et produisent des profit négatifs pour les individus que se trouvent en bas de la liste. En plus la somme des réponses (profit) réeles est égaleà la somme de réponses prévues. Cela entraine une surestimation des performances de meilleurs clients qui va compenser la sousestimation des perfomances des "mauvais" clients qui pour certains se voient attribuer des valeurs négatives.

Listing 8

  1. #Linear continous regression
  2. dt<-brabant[samp,]
  3. attach(dt)
  4. formula<-ca97 ~ r6 + rr6 + f6m + m6m + mm6m + caa96 + cda96
  5. rfm.linreg<-lm(formula)
  6. dt<-brabant[-samp,]
  7. attach(dt)
  8. predictv<-predict(rfm.linreg, newdata=dt)
  9. names(predictv)<-1:length(predictv)
  10. gc<-gainchart_cont(predictv,ca97)
  11. par(mfrow=c(2,2))
  12. plot_gaincharts_cont(gc)

Analyse:

La formule qui exprime la relation entre montant d'achat (ca97) et les variables rfm est utilisé pour calibrer un modèle linéaire dans le cadre de la procédure de régression linéaire (LM).

Pour verifier les performances predictives et economiques du modèle calibré sur deux tiers des clients on effectue les calculs prédictifs sur le tiers complémentair et on calcule le tableau des gains (gainchart).

Michel Calciu et Francis Salerno ; - Notes de cours à l'IAE de Lille 2004 - -