Niveau de signification (alpha)
Le niveau de signification (souvent noté α) est un seuil utilisé dans les tests statistiques pour déterminer si l’hypothèse nulle (H₀) doit être rejetée ou non. Il représente la probabilité de commettre une erreur de type I, c’est-à-dire la probabilité de rejeter à tort l’hypothèse nulle lorsqu’elle est en réalité vraie.
En d’autres termes, α est la probabilité maximale que l’on est prêt à accepter pour rejeter l’hypothèse nulle alors qu’elle est correcte.
Interprétation du niveau de signification (α)
-
Si tu choisis un niveau de signification α = 0.05, cela signifie que tu es prêt à accepter une probabilité de 5 % de rejeter à tort l’hypothèse nulle.
-
Cela indique que, si tu effectues de nombreux tests similaires, environ 5 % de ces tests donneraient des résultats erronés où tu rejetterais à tort l’hypothèse nulle.
Choix de α
Le niveau de signification est généralement choisi avant de réaliser le test, et il peut varier selon les domaines d’application :
-
α = 0.05 est le seuil le plus couramment utilisé dans de nombreuses disciplines, ce qui signifie qu’il y a 5 % de chances de commettre une erreur de type I.
-
α = 0.01 est parfois utilisé dans des tests où l’on veut être particulièrement strict, par exemple pour des tests cliniques où il est important de minimiser les risques d’erreurs.
-
α = 0.10 peut être utilisé dans des situations où il y a moins de risques à rejeter l’hypothèse nulle, comme dans des études exploratoires.
Niveau de signification et seuil de rejet
Le test d’hypothèse implique généralement les étapes suivantes :
-
Formulation des hypothèses :
-
H₀ (hypothèse nulle) : Par exemple, « Il n’y a pas d’effet » ou « Les moyennes des deux groupes sont égales. »
-
H₁ (hypothèse alternative) : Par exemple, « Il y a un effet » ou « Les moyennes des deux groupes sont différentes. »
-
-
Calcul de la statistique de test : Par exemple, un t-test ou un test Z est effectué en fonction des données.
-
Comparaison avec le niveau de signification (α) :
-
Si la valeur p (probabilité associée à la statistique de test) est inférieure à α, on rejette l’hypothèse nulle.
-
Si la valeur p est supérieure à α, on ne rejette pas l’hypothèse nulle.
-
Exemple concret :
Supposons que tu effectues un test pour vérifier si un nouveau médicament est plus efficace qu’un médicament existant. L’hypothèse nulle pourrait être que le médicament n’a pas d’effet supérieur à l’existant.
-
Tu choisis un niveau de signification α = 0.05.
-
Après avoir effectué le test, tu obtiens une valeur p de 0.03.
-
Comme 0.03 < 0.05, tu rejettes l’hypothèse nulle et conclues que le nouveau médicament a un effet significativement supérieur (selon ton seuil de signification).
-
-
Si la valeur p avait été, par exemple, 0.08, tu n’aurais pas rejeté l’hypothèse nulle, car 0.08 > 0.05.
Importance de α et compromis avec les erreurs de type II
-
Le niveau de signification α détermine directement la probabilité d’une erreur de type I (rejeter H₀ lorsqu’elle est vraie).
-
Un α plus faible (par exemple, 0.01) réduit le risque d’erreur de type I, mais cela augmente le risque d’erreur de type II (ne pas rejeter H₀ lorsqu’elle est fausse).
-
Un α plus élevé (par exemple, 0.10) augmente le risque d’erreur de type I, mais réduit le risque d’erreur de type II, rendant le test plus sensible.
En résumé, le choix de α doit être fait en fonction du contexte de l’expérience et de la balance entre les erreurs de type I et II.
Récapitulatif :
-
α : Le niveau de signification, ou seuil, qui représente la probabilité d’accepter une erreur de type I.
-
Si la valeur p (probabilité d’obtenir un résultat aussi extrême que celui observé) est inférieure à α, on rejette l’hypothèse nulle.
-
Si la valeur p est supérieure à α, on ne rejette pas l’hypothèse nulle.