Statistiques de base
L’analyse des statistiques de base permet de saisir rapidement les caractéristiques fondamentales d’un jeu de données. Ces mesures de tendance centrale et de dispersion servent à résumer les informations essentielles pour mieux comprendre la structure des données.
Ce que vous allez apprendre dans ce chapitre :
Moyenne
La moyenne arithmétique est une mesure de tendance centrale qui donne une valeur représentative pour un ensemble de données.
Médiane
La médiane est la valeur qui sépare un ensemble de données ordonnées en deux parties égales.
Écart-type (Standard Deviation)
L’écart-type mesure la dispersion des données autour de la moyenne.
Variance
La variance évalue aussi la dispersion, mais exprimée dans l’unité au carré.
Mode
Le mode est la valeur la plus fréquente dans un ensemble de données.
Etendue
L’étendue est la différence entre la valeur maximale et la valeur minimale.
Quartiles
Les quartiles divisent les données en quatre parties égales.
Centiles
Les centiles (ou percentiles) divisent les données en 100 parties égales.
💡 Astuce :
Comparer plusieurs mesures ensemble (moyenne, médiane, écart-type, asymétrie…) permet de mieux comprendre la structure réelle des données.