Histogrammes (hist)

  • plt.hist()

    La fonction plt.hist() permet de créer un histogramme, qui est un graphique utilisé pour représenter la distribution des données en divisant les données en intervalles (ou "buckets") et en comptant le nombre de valeurs dans chaque intervalle.

    Importation :
    import matplotlib.pyplot as plt
    Attributs :
    Paramètre Type Description Valeur par défaut
    x array-like Les données à afficher sous forme d’histogramme (ex : une liste ou un tableau de données numériques). None
    bins int / sequence Le nombre de bins (ou intervalles) ou une séquence de bords de bins. Par exemple, une liste de valeurs pour définir explicitement les bords des bins. 10
    range tuple La plage des valeurs à inclure dans l’histogramme sous forme de tuple (min, max). None
    density bool Si True, l’histogramme sera normalisé pour que l’aire sous l’histogramme soit égale à 1. Cela est utile pour comparer des distributions. False
    color str La couleur des barres de l’histogramme. 'blue'
    histtype str Le type d’histogramme à afficher : ‘bar’, ‘barstacked’, ‘step’, ‘stepfilled’. 'bar'
    align str Détermine l’alignement des barres : ‘left’, ‘mid’, ou ‘right’. 'mid'
    Exemple de code :
    import matplotlib.pyplot as plt
    import numpy as np
    
    # Génération de données aléatoires
    data = np.random.randn(1000)
    
    # Création de l'histogramme
    plt.hist(data, bins=30, color='skyblue', edgecolor='black', density=True)
    
    # Ajouter un titre et afficher le graphique
    plt.title("Histogramme de données aléatoires")
    plt.xlabel("Valeurs")
    plt.ylabel("Fréquence")
    plt.show()
    Explication du code :

    La fonction plt.hist() est utilisée pour créer un histogramme des données dans data. L’argument bins=30 définit le nombre d’intervalles (30 bins), color='skyblue' choisit la couleur des barres, edgecolor='black' définit la couleur des bords des barres, et density=True normalise l’histogramme.

    Remarques :

      • Personnalisation : Vous pouvez ajuster la couleur des barres, leur nombre, ainsi que la plage de valeurs à afficher en utilisant les différents paramètres de la fonction.

      • Normalisation : Lorsque density=True, l’histogramme est normalisé, ce qui est utile pour les comparaisons de distributions de données avec différentes tailles d’échantillons.

      • Type d’histogramme : L’argument histtype permet de choisir entre différents types d’histogrammes, comme les barres empilées (barstacked) ou les contours (step).