Rug Plot
Le Rug Plot est un graphique minimaliste mais puissant qui permet de visualiser la distribution brute des données le long d’un axe, en affichant une petite barre verticale (ou « hachure ») pour chaque observation.
Ce type de diagramme ne remplace pas un histogramme ou un KDE Plot, mais il les complète parfaitement en montrant l’emplacement exact des points de données individuels. Il est particulièrement utile pour :
-
Vérifier la densité locale de points
-
Identifier des groupes ou concentrations de valeurs
-
Détecter la présence de duplicatas ou de zones vides
Fonctions :
-
sns.rugplot()
La fonction sns.rugplot() est utilisée pour ajouter un graphique de "rug" (tapis de rugissement) à un axe, qui est un graphique unidimensionnel représentant la distribution des données sous forme de petites lignes verticales (ou "rug" sur l'axe des x ou y). Elle permet de visualiser la densité des données le long d'un seul axe.
Importation :
import seaborn as snsAttributs :
Paramètre Type Description Valeur par défaut dataDataFrame Le DataFrame contenant les données à visualiser. Nonexstr Nom de la variable à utiliser pour l'axe des x. Noneystr Nom de la variable à utiliser pour l'axe des y. Nonehuestr Nom de la variable dans les données pour colorer les rug en fonction d'une catégorie. Noneheightfloat Hauteur des rug. 0.05axismatplotlib axis L'axe sur lequel afficher le rug plot (utile pour la personnalisation de l'affichage). Nonecolorstr Couleur des rug. "k"linewidthfloat Épaisseur des lignes représentant les rug. 1.0Exemple de code :
import seaborn as sns import matplotlib.pyplot as plt # Création d'un DataFrame exemple data = sns.load_dataset("tips") # Tracer un rugplot pour visualiser la distribution de la variable total_bill sns.rugplot(x="total_bill", data=data, color="b") plt.show()
Explication du code :
import seaborn as snsimporte la bibliothèque seaborn, utilisée pour la visualisation de données statistiques en Python.import matplotlib.pyplot as pltimporte la bibliothèque matplotlib.pyplot pour la création de graphiques.Création d'un DataFrame exemple
data = sns.load_dataset("tips")charge le dataset "tips", qui contient des informations sur les pourboires dans des restaurants, et l'assigne à la variabledata.Tracer un rugplot pour visualiser la distribution de la variable 'total_bill'
sns.rugplot(x="total_bill", data=data, color="b")trace un rugplot, qui est une représentation graphique de la distribution des données. Il affiche des petites marques (rug) sur l'axe des X, chaque marque représentant un point de donnée pour la variable 'total_bill'. Le paramètre color="b" définit la couleur des marques en bleu.Afficher le graphique
plt.show()affiche le graphique généré à l'écran.