· a) Test du caractère significatif de la relation entre les variables

Dans le chapitre précédent on a vu une application du test du Khi-Deux pour l'évaluation de la qualité de l'ajustement d'une distribution de fréquences observées à une distribution théorique.

De façon plus générale, ce test est employé pour analyser les tableaux de contingence et repérer le caractère statistiquement significatif de l'association entre deux variables nominales.

La statistique du est donnée, en ce qui concerne les tableaux de contingence, par la formule suivante:

(22)

Nij = nombre d'observations dans la case ij; Qij = nombre théorique associé à la case ij = (Total de la ligne i).(Total de la colonne j)/Nombre total d'observations.

Pour un tableau comportant C colonnes et L lignes, la valeur ainsi calculée est comparée à la valeur critique lue sur la table du Khi-Deux pour un seuil de confiance , et pour un nombre de degrés de liberté égal à (C - 1)(L - 1) .

La table du Khi-Deux donne la distribution de probabilité des valeurs de obtenues dans un tableau lorsque l'hypothèse nulle est vraie, c'est-à-dire dans le cas d'indépendance entre les deux variables étudiées. Par exemple, au seuil de 5 % et pour deux degrés de liberté, le lu sur la table vaut 5,99 : ceci veut dire que sous Ho il n'y a que 5 % de tableaux à deux degrés de liberté pour lesquels on pourrait calculer un x2 supérieur ou égal à 5,99. Si le calculé est plus fort, il y a donc moins de cinq chances sur cent de se tromper en rejetant Ho.

Michel Calciu; - Cours à l'Université de Lille 1 - 2018/2019 - -