FacetGrid et PairGrid

Dans le cadre de l’analyse exploratoire de données (EDA), il est essentiel de pouvoir visualiser efficacement les relations entre plusieurs variables, ainsi que les répartitions conditionnelles selon différentes catégories. C’est précisément dans ce contexte que les objets FacetGrid et PairGrid de la bibliothèque Seaborn prennent tout leur sens.

Ces deux classes puissantes permettent de créer des grilles de graphiques, où chaque sous-graphe (ou facet) représente une sous-population des données, selon une ou plusieurs variables catégorielles. Cela facilite l’observation de motifs, de distributions ou de relations complexes à travers différentes dimensions de vos données.

Vous découvrirez comment utiliser FacetGrid et PairGrid, comprendre leur logique de fonctionnement, et apprendre à les personnaliser pour vos propres analyses visuelles.

Fonctions :

  • sns.FacetGrid()

    La fonction sns.FacetGrid() est utilisée pour créer un grille de visualisation qui permet de montrer plusieurs graphiques en fonction de différentes catégories de données. Elle permet de créer une grille de sous-graphes où chaque sous-graphique correspond à une combinaison de variables catégorielles.

    Importation :

    import seaborn as sns

    Attributs :

    Paramètre Type Description Valeur par défaut
    data DataFrame Le DataFrame contenant les données à visualiser. None
    row str Nom de la variable dans les données pour les lignes de la grille. None
    col str Nom de la variable dans les données pour les colonnes de la grille. None
    hue str Nom de la variable dans les données pour colorer les points dans les graphiques. None
    palette str / list Palette de couleurs à utiliser pour les différentes catégories de la variable hue. None

    Exemple de code :

    import seaborn as sns
    import matplotlib.pyplot as plt
    
    # Chargement des données d'exemple
    tips = sns.load_dataset("tips")
    
    # Création d'une FacetGrid
    g = sns.FacetGrid(tips, col="sex", row="time")
    
    # Tracer un graphique dans chaque sous-graphe
    g.map(sns.scatterplot, "total_bill", "tip")
    
    # Afficher la grille
    plt.show()
    Résultat du code
  • sns.PairGrid()

    seaborn.PairGrid() est une fonction qui permet de créer une grille de graphiques pour visualiser les relations entre toutes les paires de variables dans un DataFrame. Elle permet de personnaliser les types de graphiques pour la partie supérieure, inférieure et diagonale de la grille.

    Importation :

    import seaborn as sns
    import matplotlib.pyplot as plt
    import pandas as pd

    Attributs :

    Paramètre Type Description Valeur par défaut
    data DataFrame Le DataFrame contenant les données à visualiser. None
    hue str Nom de la variable catégorielle pour la colorisation. None
    palette str, list, or dict Palette de couleurs à utiliser. None
    height float Hauteur de chaque sous-graphique de la grille (en pouces). 2.5
    aspect float Rapport largeur/hauteur de chaque sous-graphique. 1

    Exemple de code :

    import seaborn as sns
    
    # Charger un dataset intégré (iris dataset)
    iris = sns.load_dataset("iris")
    
    # Créer une PairGrid
    g = sns.PairGrid(iris)
    
    # Appliquer un graphique de type 'scatter' pour chaque paire de variables
    g.map_lower(sns.kdeplot)  # Courbes de densité pour la partie inférieure de la grille
    g.map_diag(sns.histplot)  # Histogrammes pour la partie diagonale
    g.map_upper(sns.scatterplot)  # Scatter plots pour la partie supérieure
    
    # Afficher la grille
    plt.show()
    Résultat du code