Régression en deux étapes.

Comme dans la régression linéaire le modèle Tobit suppose que la variable de réponse peut prendre toute valeur, même des valeurs négatives mais comme ces dernières ne sont pas disponibles car il n'y a pas des observations pour les non-répondants elles sont censurées et substitués par la valeur zéro. C’est une supposition qui n'est pas très réaliste car en marketing direct les réponses égales à zéro surviennent parce que certains clients choisissent de décliner l'offre et non pas parce que la réponse était négative et par conséquence censurée à zéro. Pour subvenir à ce problème que présente le modèle Tobit une solution alternative est d'estimer une réponse continue en deux étapes en utilisant le modèle en deux étapes de Heckman (1979).

Dans une première étape on applique un modèle de choix binaire (par exemple le modèle logistique) à l'échantillon d'estimation. Dans l’étape suivante un modèle linéaire est estimé uniquement au niveau de répondants pour estimer la réponse (conditionnelle) espéré par client à condition que celui-ci soit un répondant

Ensuite un modèle la réponse (inconditionnelle) espérée par client est obtenu en multipliant la réponse conditionnelle par la probabilité d'achat. Le modèle à deux étapes souffre du biais de sélection car il est basé uniquement sur les répondants et ne constitue donc pas un échantillon aléatoire de la population. Pour subvenir au biais de sélection Heckman estime un facteur de correction qu’il utilise comme variable supplémentaire dans le deuxième modèle. Dans le cas d’une distribution logistique ce facteur est la probabilité de réponse estimé par le premier modèle.

Michel CALCIU, Francis SALERNO; - Congrès AFM, Nancy 2005  - -