La régression linéaire

Le problème posé est d'estimer les paramètres de notre modèle, ceci ne poserait pas de problème si on avait une première estimation de p. Or tout ce que l'on connaît est le fait que les individus ont acheté ou n'ont pas acheté.

Reconsidérons le modèle. Le premier point à préciser est que p(A=1), représente en fait une moyenne : c'est la proportion des individus qui ont acheté et qui possèdent un vecteur commun de caractéristiques X. Un moyen simple d'estimer le modèle, serait alors de regrouper les individus qui ont un même profil, de calculer cette proportion, et d'utiliser celle-ci comme valeur de la probabilité. On calcule ensuite le logit, et il n'y a plus qu'à appliquer une méthode de MCO.

 

Y

X1

X2

CLASSE

P*

logit

1

0

1

1

2/3

0,6931

1

0

1

1

2/3

0,6931

1

0

0

2

1/2

0

0

0

1

1

2/3

0,6931

0

0

0

2

1/2

0

1

1

0

3

1/4

-1,0986

0

1

0

3

1/4

-1,0986

0

1

0

3

1/4

-1,0986

0

1

0

3

1/4

-1,0986

0

1

1

4

1/3

-0,6931

0

1

1

4

1/3

-0,6931

1

1

1

4

1/3

-0,6931

 Cette méthode peut être raffinée, mais ce n'est pas celle qui est effectivement employée, même si d'un point de vue pédagogique, elle a un intérêt certain.

Christophe Benavent christophe.benavent@free.fr; Michel Calciu mihai.calciu@iae.univ-lille1.fr; - Cours en DESS SSBD à l’IAE de Lille, 2002 - -