Rug Plot
Le Rug Plot est un graphique minimaliste mais puissant qui permet de visualiser la distribution brute des données le long d’un axe, en affichant une petite barre verticale (ou « hachure ») pour chaque observation.
Ce type de diagramme ne remplace pas un histogramme ou un KDE Plot, mais il les complète parfaitement en montrant l’emplacement exact des points de données individuels. Il est particulièrement utile pour :
-
Vérifier la densité locale de points
-
Identifier des groupes ou concentrations de valeurs
-
Détecter la présence de duplicatas ou de zones vides
Fonctions :
-
sns.rugplot()
La fonction sns.rugplot() est utilisée pour ajouter un graphique de "rug" (tapis de rugissement) à un axe, qui est un graphique unidimensionnel représentant la distribution des données sous forme de petites lignes verticales (ou "rug" sur l'axe des x ou y). Elle permet de visualiser la densité des données le long d'un seul axe.
Importation :
import seaborn as sns
Attributs :
Paramètre Type Description Valeur par défaut data
DataFrame Le DataFrame contenant les données à visualiser. None
x
str Nom de la variable à utiliser pour l'axe des x. None
y
str Nom de la variable à utiliser pour l'axe des y. None
hue
str Nom de la variable dans les données pour colorer les rug en fonction d'une catégorie. None
height
float Hauteur des rug. 0.05
axis
matplotlib axis L'axe sur lequel afficher le rug plot (utile pour la personnalisation de l'affichage). None
color
str Couleur des rug. "k"
linewidth
float Épaisseur des lignes représentant les rug. 1.0
Exemple de code :
import seaborn as sns import matplotlib.pyplot as plt # Création d'un DataFrame exemple data = sns.load_dataset("tips") # Tracer un rugplot pour visualiser la distribution de la variable total_bill sns.rugplot(x="total_bill", data=data, color="b") plt.show()
Explication du code :
import seaborn as sns
importe la bibliothèque seaborn, utilisée pour la visualisation de données statistiques en Python.import matplotlib.pyplot as plt
importe la bibliothèque matplotlib.pyplot pour la création de graphiques.Création d'un DataFrame exemple
data = sns.load_dataset("tips")
charge le dataset "tips", qui contient des informations sur les pourboires dans des restaurants, et l'assigne à la variabledata
.Tracer un rugplot pour visualiser la distribution de la variable 'total_bill'
sns.rugplot(x="total_bill", data=data, color="b")
trace un rugplot, qui est une représentation graphique de la distribution des données. Il affiche des petites marques (rug) sur l'axe des X, chaque marque représentant un point de donnée pour la variable 'total_bill'. Le paramètre color="b" définit la couleur des marques en bleu.Afficher le graphique
plt.show()
affiche le graphique généré à l'écran.