FacetGrid et PairGrid
Dans le cadre de l’analyse exploratoire de données (EDA), il est essentiel de pouvoir visualiser efficacement les relations entre plusieurs variables, ainsi que les répartitions conditionnelles selon différentes catégories. C’est précisément dans ce contexte que les objets FacetGrid et PairGrid de la bibliothèque Seaborn prennent tout leur sens.
Ces deux classes puissantes permettent de créer des grilles de graphiques, où chaque sous-graphe (ou facet) représente une sous-population des données, selon une ou plusieurs variables catégorielles. Cela facilite l’observation de motifs, de distributions ou de relations complexes à travers différentes dimensions de vos données.
-
FacetGrid est idéal pour tracer un même type de graphique (comme un histogramme, un nuage de points, etc.) à travers différentes sous-catégories d’une ou deux variables.
-
PairGrid, quant à lui, est utilisé pour examiner les relations entre toutes les paires de variables numériques d’un DataFrame, et permet une personnalisation fine des types de graphiques affichés sur la diagonale, au-dessus ou en dessous.
Vous découvrirez comment utiliser FacetGrid et PairGrid, comprendre leur logique de fonctionnement, et apprendre à les personnaliser pour vos propres analyses visuelles.
Fonctions :
-
sns.FacetGrid()
La fonction sns.FacetGrid() est utilisée pour créer un grille de visualisation qui permet de montrer plusieurs graphiques en fonction de différentes catégories de données. Elle permet de créer une grille de sous-graphes où chaque sous-graphique correspond à une combinaison de variables catégorielles.
Importation :
import seaborn as sns
Attributs :
Paramètre Type Description Valeur par défaut data
DataFrame Le DataFrame contenant les données à visualiser. None
row
str Nom de la variable dans les données pour les lignes de la grille. None
col
str Nom de la variable dans les données pour les colonnes de la grille. None
hue
str Nom de la variable dans les données pour colorer les points dans les graphiques. None
palette
str / list Palette de couleurs à utiliser pour les différentes catégories de la variable hue
.None
Exemple de code :
import seaborn as sns import matplotlib.pyplot as plt # Chargement des données d'exemple tips = sns.load_dataset("tips") # Création d'une FacetGrid g = sns.FacetGrid(tips, col="sex", row="time") # Tracer un graphique dans chaque sous-graphe g.map(sns.scatterplot, "total_bill", "tip") # Afficher la grille plt.show()
-
sns.PairGrid()
seaborn.PairGrid() est une fonction qui permet de créer une grille de graphiques pour visualiser les relations entre toutes les paires de variables dans un DataFrame. Elle permet de personnaliser les types de graphiques pour la partie supérieure, inférieure et diagonale de la grille.
Importation :
import seaborn as sns import matplotlib.pyplot as plt import pandas as pd
Attributs :
Paramètre Type Description Valeur par défaut data
DataFrame Le DataFrame contenant les données à visualiser. None
hue
str Nom de la variable catégorielle pour la colorisation. None
palette
str, list, or dict Palette de couleurs à utiliser. None
height
float Hauteur de chaque sous-graphique de la grille (en pouces). 2.5
aspect
float Rapport largeur/hauteur de chaque sous-graphique. 1
Exemple de code :
import seaborn as sns # Charger un dataset intégré (iris dataset) iris = sns.load_dataset("iris") # Créer une PairGrid g = sns.PairGrid(iris) # Appliquer un graphique de type 'scatter' pour chaque paire de variables g.map_lower(sns.kdeplot) # Courbes de densité pour la partie inférieure de la grille g.map_diag(sns.histplot) # Histogrammes pour la partie diagonale g.map_upper(sns.scatterplot) # Scatter plots pour la partie supérieure # Afficher la grille plt.show()