Skip to content

Concepts clés à la compréhension de la statistique inférentielle

Introduction

Cette page contient les informations nécessaires à la compréhension de la statistique inférentielle. Certaines explications ne sont peut-être pas suffisamment concrètes, mais elles seront expliquées à nouveau lorsqu'elles seront nécessaires.

Hypothèses

En statistiques, on distingue deux hypothèses: l'hypothèse nulle et l'hypothèse alternative. La première, — souvent appelée H0 — est celle qui est retenue «par défaut», et selon laquelle nos résultats ne seraient dûs qu'au hasard. L'hypothèse alternative (H1), elle, postule au contraire que nos résultats sont dûs à la manipulation de certaines variables au cours de l'expérience.

Hypothèse nulle (H0) Hypothèse alternative (H1)
Nos résultats ne sont dûs qu'au hasard. Nos résultats sont dûs à la manipulation de certaines variables au cours de l'expérience.
Retenue par défaut. Retenue uniquement si H0 est infirmée.

Ce que la statistique inférentielle vient faire, c'est de calculer la probabilité que l'hypothèse nulle soit vraie par rapport aux résultats obtenus. Sur la base de ce calcul, nous serons en mesure d'accepter ou de rejetter cette hypothèse nulle.

Attention à la terminologie

Il est important de noter que l'on ne cherche jamais à prouver l'hypothèse alternative. À la place, on parle d'accepter ou bien de rejetter l'hypothèse nulle.

p-valeur

En statistique inférentielle, la valeur p (p-value) est une mesure de la probabilité d'obtenir les résultats que nous avons obtenus dans le cas où l'hypothèse nulle serait vraie. En d'autres termes, plus cette p-valeur est petite, plus la probabilité d'avoir obtenu ces résultats par hasard est faible.

Seuil de significativité

Comme nous l'avons vu, la p-valeur est utilisée pour accepter ou rejetter l'hypothèse nulle. Pour ce faire, nous utilisons un seuil de significativité, le plus souvent représenté par la lettre grecque α (alpha). Ce seuil représente la probabilité de commettre une erreur de première espèce (cf. tableau ci-dessous).

Type d'erreur Conséquence En d'autres termes...
Erreur de 1e espèce Rejet de l'hypothèse nulle alors que celle-ci est vérifiée. On trouve un effet statistique alors qu'il n'y en a pas.
Erreur de 2e espèce Acceptation de l'hypothèse nulle alors que celle-ci est infirmée. On ne trouve pas d'effet statistique alors qu'il y en a un.

Il faut donc choisir un seuil qui fait sens en fonction du type d'expérience menée. En médecine, par exemple, des seuils très bas sont utilisés, puisqu'une erreur de 1e espèce pourrait avoir des conséquences monétaires ou humaines désastrueuses.

Bon à savoir

En psychologie, on utilise la plupart du temps un seuil à .05 (= 5% de risque de commettre une erreur de 1e espèce).

Interprétation

Lorsque nous utilisons un test statistique, celui-ci nous indique plusieurs informations, dont la p-valeur évoquée ci-dessus. Si cette p-valeur est inférieur au seuil de significativité choisi, nous rejettons l'hypothèse nulle, ce qui signifie que nous retenons l'hypothèse alternative selon laquelle nos résultats ne sont pas dûs au hasard. Si la p-valeur est égale ou supérieure au seuil, nous acceptons l'hypothèse nulle, ce qui signifie que nos résultats sont dûs au hasard.

Résultat du test Conclusion
p<α Rejet de l'hypothèse nulle au seuil α.
p>=α Acceptation de l'hypothèse nulle au seuil α.

Exemple

Nous nous appretons à réaliser une petite expérience, pour laquelle nous allons utiliser un seuil à 5%. Nous pouvons donc ajuster notre tableau:

Résultat du test Conclusion
p<.05 Rejet de l'hypothèse nulle au seuil de 5%.
p>=.05 Acceptation de l'hypothèse nulle au seuil de 5%.

Dans cette expérience, nous allons tenter de voir si le fait de mouiller une pièce de monnaie permet de pré-définir le résultat d'une partie de pile ou face. Il semble évident que non, mais nous allons tenter de le vérifier expérimentalement. Nous pouvons donc établir nos hypothèses:

Hypothèse nulle (H0) Hypothèse alternative (H1)
Mouiller la pièce n'a aucune influence sur le résultat. Mouiller la pièce influence le résultat.

Ce que nous faisons, c'est que nous réalisons donc un certain nombre de lancers d'une pièce mouillée et notons les résultats. Logiquement, si le fait de mouiller la pièce n'a aucun impact sur le résultat, nous devrions obtenir plus ou moins 50% de pile et 50% de face. Mais il est très rare d'obtenir exactement 50%.

Les résultats de notre expérience sont les suivants: sur 10 lancers avec la pièce mouillée, nous ayons obtenu 4 piles et 6 faces, ce qui n'est en effet pas exactement 50%. La question est maintenant la suivante: est-il probable ou non que ces résultats soient dûs au hasard? C'est là qu'entre en jeu la p-valeur. Nous réalisons donc un test statistique sur nos données, et ce dernier nous indique que p=0.7539.

Puisque 0.7539 est supérieur à notre seuil de 0.05, nous ne pouvons pas rejetter l'hypothèse nulle, ce qui signifie qu'il ne nous est pas possible d'affirmer que mouiller la pièce aurait un quelconque effet sur les résultats d'une partie de pile ou face.

Si maintenant nous avions eu 1 pile et 9 face dans nos données, alors la p-valeur aurait été de 0.02148 et nous aurions donc pu rejetter l'hypothèse nulle au seuil de 5%, étant donné que 0.02148<0.05.