· a) Test du caractère significatif de la relation entre les variables
Dans le chapitre précédent on a vu une application du test du Khi-Deux pour l'évaluation de la qualité de l'ajustement d'une distribution de fréquences observées à une distribution théorique.
De façon plus générale, ce test est employé pour analyser les tableaux de contingence et repérer le caractère statistiquement significatif de l'association entre deux variables nominales.
La statistique du
est donnée, en ce qui concerne les tableaux de contingence,
par la formule suivante:
(22)
où Nij = nombre d'observations dans la case ij; Qij = nombre théorique associé à la case ij = (Total de la ligne i).(Total de la colonne j)/Nombre total d'observations.
Pour un tableau comportant C colonnes et
L lignes, la valeur ainsi calculée est comparée
à la valeur critique
lue sur la table du Khi-Deux pour un seuil de confiance
,
et pour un nombre de degrés de liberté égal à
(C - 1)(L - 1) .
La table du Khi-Deux donne la distribution de
probabilité des valeurs de
obtenues dans un tableau lorsque l'hypothèse nulle est vraie,
c'est-à-dire dans le cas d'indépendance entre les deux
variables étudiées. Par exemple, au seuil de 5 % et
pour deux degrés de liberté, le
lu sur la table vaut 5,99 : ceci veut dire que sous Ho il n'y a
que 5 % de tableaux à deux degrés de liberté
pour lesquels on pourrait calculer un x2 supérieur ou égal
à 5,99. Si le
calculé est plus fort, il y a donc moins de cinq chances sur
cent de se tromper en rejetant Ho.