Intervalles de confiance et p-values

Les intervalles de confiance et les p-values sont des concepts fondamentaux en statistique inférentielle. Ils permettent de quantifier l’incertitude autour des estimations faites à partir d’un échantillon de données. Ils sont utilisés pour tester des hypothèses et estimer des paramètres inconnus d’une population à partir des données disponibles.


🔹 Intervalle de confiance

Un intervalle de confiance (IC) est une plage de valeurs qui, selon un certain niveau de confiance, contient le paramètre inconnu d’une population. Par exemple, si nous estimons la moyenne d’une population à partir d’un échantillon, un intervalle de confiance nous donne une fourchette dans laquelle la véritable moyenne de la population devrait se situer avec une certaine probabilité.

1. Formule de l’intervalle de confiance pour la moyenne (avec écart-type connu)

Pour une population normalement distribuée, l’intervalle de confiance pour la moyenne μ\mu est donné par :

IC=xˉ±Zα/2σnIC = \bar{x} \pm Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

2. Intervalle de confiance pour une moyenne (écart-type inconnu)

Si l’écart-type de la population est inconnu, on utilise la distribution t de Student :

IC=xˉ±tα/2,n1snIC = \bar{x} \pm t_{\alpha/2, n-1} \cdot \frac{s}{\sqrt{n}}

3. Interprétation

Si nous avons un intervalle de confiance de 95% pour une moyenne, cela signifie que si nous répétions l’expérience de nombreuses fois, 95% des intervalles construits à partir de nouveaux échantillons contiendraient la vraie moyenne de la population.


🔹 p-value

La p-value est une mesure qui permet de tester une hypothèse nulle en statistique. Elle indique la probabilité d’observer les résultats obtenus (ou des résultats plus extrêmes) si l’hypothèse nulle était vraie. En d’autres termes, la p-value permet de déterminer si les résultats d’une étude sont statistiquement significatifs.

1. Interprétation de la p-value
2. Formule de la p-value

La p-value dépend de la statistique de test (t, χ², F, etc.) et de la distribution associée. Par exemple, pour un test t, la p-value est la probabilité d’obtenir une statistique t aussi extrême ou plus extrême que celle observée, sous l’hypothèse nulle.

p=P(statistique observeˊestatistique sous H₀)p = P(\text{statistique observée} \geq \text{statistique sous H₀})

3. Erreur de Type I et Type II

📊 Relation entre p-value et intervalle de confiance

Les p-values et les intervalles de confiance sont étroitement liés. Si l’intervalle de confiance pour un paramètre (par exemple, une moyenne) ne contient pas la valeur spécifiée sous l’hypothèse nulle, cela implique que la p-value associée à ce test est inférieure au seuil de signification (souvent 0.05).


📌 Bonnes pratiques pour utiliser p-value et intervalles de confiance


Conclusion

Les intervalles de confiance et les p-values sont deux concepts essentiels pour tirer des conclusions en statistique. Tandis que les intervalles de confiance fournissent une estimation de la plage probable d’un paramètre, les p-values aident à tester des hypothèses sur la base des données. Ces outils sont utilisés ensemble pour réaliser une analyse statistique robuste.

Sous-sections du Chapitre

  • Aucune sous-section disponible pour cette section.