Centiles

Fonctions :

  • np.percentile()

    La fonction np.percentile() de NumPy permet de calculer le ou les percentiles d’un tableau de données. Un percentile est une valeur sous laquelle se situe un certain pourcentage des données. Par exemple, le 90e percentile représente la valeur en dessous de laquelle se trouvent 90 % des observations.

    Importation :

    import numpy as np

    Attributs :

    Nom Type Description
    a array_like Tableau d’entrée contenant les données numériques.
    q float ou array_like de float Percentile(s) à calculer. Doit être compris entre 0 et 100.
    axis int ou None, optionnel Axe le long duquel les percentiles sont calculés. Par défaut, l’ensemble du tableau est utilisé.
    out ndarray, optionnel Emplacement dans lequel stocker le résultat.
    overwrite_input bool, optionnel Si True, les données d’entrée peuvent être modifiées pour améliorer les performances.
    method {'linear', 'lower', 'higher', 'midpoint', 'nearest'}, optionnel Méthode d’interpolation utilisée si la position du percentile ne tombe pas exactement sur une valeur du tableau.
    keepdims bool, optionnel Si True, les dimensions réduites sont conservées avec taille 1.

    Exemple de code :

    import numpy as np
    
    data = np.array([10, 20, 30, 40, 50, 60, 70, 80, 90, 100])
    p90 = np.percentile(data, 90)
    p50 = np.percentile(data, 50)  # équivalent à la médiane
    
    print("90e percentile :", p90)
    print("Médiane (50e percentile) :", p50)
    Résultat du code

    Explication du code :

    La ligne import numpy as np importe la bibliothèque NumPy, renommée ici en np pour simplifier son utilisation dans le code.

    Création d'un tableau de données

    La fonction np.array() crée un tableau NumPy à partir de la liste donnée, ici contenant les valeurs [10, 20, 30, 40, 50, 60, 70, 80, 90, 100], et l'assigne à la variable data.

    Calcul du 90e percentile

    La fonction np.percentile() permet de calculer le percentile d'un ensemble de données. Ici, np.percentile(data, 90) calcule le 90e percentile des données dans le tableau data, ce qui représente la valeur en dessous de laquelle 90 % des valeurs de data se situent. Ce résultat est stocké dans la variable p90.

    Calcul de la médiane (50e percentile)

    De manière similaire, np.percentile(data, 50) calcule la médiane, qui est le 50e percentile des données. Cela divise les données en deux groupes égaux. Le résultat est stocké dans la variable p50.

    Affichage des résultats

    Les lignes suivantes print("90e percentile :", p90) et print("Médiane (50e percentile) :", p50) affichent respectivement les valeurs du 90e percentile et de la médiane (50e percentile).