Centiles
Les centiles, aussi appelés percentiles, sont des mesures statistiques qui divisent un ensemble de données triées en 100 parties égales. Chaque centile indique la valeur en dessous de laquelle se situe un certain pourcentage des données. Par exemple, le 25e centile correspond à la valeur sous laquelle se trouvent 25 % des observations.
Ils sont très utilisés pour interpréter des scores dans un contexte relatif. Par exemple, un élève se situant au 80e centile d’un test a obtenu un score supérieur à 80 % des participants. Les centiles sont également employés en finance, en médecine (comme pour suivre la croissance d’un enfant), ou encore en analyse de performances.
Les centiles permettent une compréhension fine de la distribution des données, au-delà des mesures centrales classiques comme la moyenne ou la médiane. Les centiles particuliers comme le 25e (Q1), 50e (médiane), et 75e (Q3) correspondent aussi aux quartiles.
Dans cette page, vous découvrirez :
- Comment calculer les centiles manuellement ou avec des outils comme Python ou Excel,
- Comment les interpréter dans différents domaines,
- Comment les représenter graphiquement avec des diagrammes ou des courbes de distribution cumulée.
Fonctions :
-
np.percentile()
La fonction np.percentile() de NumPy permet de calculer le ou les percentiles d’un tableau de données. Un percentile est une valeur sous laquelle se situe un certain pourcentage des données. Par exemple, le 90e percentile représente la valeur en dessous de laquelle se trouvent 90 % des observations.
Importation :
import numpy as np
Attributs :
Nom Type Description a array_like Tableau d’entrée contenant les données numériques. q float ou array_like de float Percentile(s) à calculer. Doit être compris entre 0 et 100. axis int ou None, optionnel Axe le long duquel les percentiles sont calculés. Par défaut, l’ensemble du tableau est utilisé. out ndarray, optionnel Emplacement dans lequel stocker le résultat. overwrite_input bool, optionnel Si True, les données d’entrée peuvent être modifiées pour améliorer les performances. method {'linear', 'lower', 'higher', 'midpoint', 'nearest'}, optionnel Méthode d’interpolation utilisée si la position du percentile ne tombe pas exactement sur une valeur du tableau. keepdims bool, optionnel Si True, les dimensions réduites sont conservées avec taille 1. Exemple de code :
import numpy as np data = np.array([10, 20, 30, 40, 50, 60, 70, 80, 90, 100]) p90 = np.percentile(data, 90) p50 = np.percentile(data, 50) # équivalent à la médiane print("90e percentile :", p90) print("Médiane (50e percentile) :", p50)
Explication du code :
La ligne
import numpy as np
importe la bibliothèque NumPy, renommée ici ennp
pour simplifier son utilisation dans le code.Création d'un tableau de données
La fonction
np.array()
crée un tableau NumPy à partir de la liste donnée, ici contenant les valeurs[10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
, et l'assigne à la variabledata
.Calcul du 90e percentile
La fonction
np.percentile()
permet de calculer le percentile d'un ensemble de données. Ici,np.percentile(data, 90)
calcule le 90e percentile des données dans le tableaudata
, ce qui représente la valeur en dessous de laquelle 90 % des valeurs dedata
se situent. Ce résultat est stocké dans la variablep90
.Calcul de la médiane (50e percentile)
De manière similaire,
np.percentile(data, 50)
calcule la médiane, qui est le 50e percentile des données. Cela divise les données en deux groupes égaux. Le résultat est stocké dans la variablep50
.Affichage des résultats
Les lignes suivantes
print("90e percentile :", p90)
etprint("Médiane (50e percentile) :", p50)
affichent respectivement les valeurs du 90e percentile et de la médiane (50e percentile).