Dis Plot

La fonction displot() de Seaborn est une fonction haut-niveau dédiée à la visualisation de distributions univariées et bivariées. Elle constitue une interface pratique et puissante pour créer des histogrammes, courbes de densité (KDE) ou combinaisons des deux, avec facilité et flexibilité.

Contrairement à histplot() ou kdeplot() qui s’intègrent dans des axes existants (ax), displot() génère un objet FacetGrid, ce qui le rend idéal pour :

Cas d’usage typiques :

Fonctions :

  • sns.displot()

    La fonction sns.displot() permet de tracer une distribution univariée ou bivariée sous forme d'histogramme ou de kernel density estimate (KDE). Elle est particulièrement utile pour visualiser la distribution d'une variable, et peut être utilisée pour des tracés simples ou plus complexes avec plusieurs types de visualisations combinées.

    Importation :

    import seaborn as sns

    Attributs :

    Paramètre Type Description Valeur par défaut
    data DataFrame Le DataFrame contenant les données à visualiser. None
    x str Nom de la variable à tracer sur l'axe des x (données continues). None
    hue str Nom de la variable à utiliser pour colorer les données par catégories. None
    kind str Type de graphique à tracer. Les options incluent "hist" (par défaut), "kde", "ecdf", et "step" pour l'histogramme, la densité de noyau, la fonction de répartition empirique et l'histogramme avec étapes, respectivement. "hist"
    bins int Nombre de bins (intervalles) dans l'histogramme. 10
    kde bool Si True, une courbe KDE est tracée sur l'histogramme. False
    height float Hauteur du graphique, en pouces. 5
    aspect float Rapport d'aspect du graphique. Un aspect de 1.0 signifie un graphique carré. 1.0

    Exemple de code :

    import seaborn as sns
    import matplotlib.pyplot as plt
    
    # Chargement du dataset "tips"
    data = sns.load_dataset("tips")
    
    # Tracer la distribution de la variable 'total_bill' sous forme d'histogramme avec une courbe KDE
    sns.displot(data=data, x="total_bill", kde=True)
    
    plt.show()
    Résultat du code

    Explication du code :

    import seaborn as sns importe la bibliothèque seaborn, qui est utilisée pour la visualisation de données statistiques en Python.

    import matplotlib.pyplot as plt importe la bibliothèque matplotlib.pyplot pour la création de graphiques.

    Chargement du dataset "tips"

    data = sns.load_dataset("tips") charge le dataset "tips", qui contient des informations sur les pourboires dans des restaurants, et l'assigne à la variable data.

    Tracer la distribution de la variable 'total_bill' sous forme d'histogramme avec une courbe KDE

    sns.displot(data=data, x="total_bill", kde=True) trace la distribution de la variable 'total_bill' (montant total de l'addition) sous forme d'un histogramme avec une courbe de densité de noyau (KDE) pour estimer la distribution des données.

    Afficher le graphique

    plt.show() affiche le graphique généré à l'écran.