Boîte à moustaches
La boîte à moustaches, ou box plot, est un graphique statistique essentiel pour résumer la distribution d’une variable numérique. Elle permet de visualiser rapidement la médiane, les quartiles, ainsi que les valeurs extrêmes ou aberrantes (outliers).
Ce type de graphique est particulièrement utile pour comparer la dispersion et la symétrie des données entre plusieurs groupes, facilitant ainsi la détection de différences ou anomalies.
Les bibliothèques Matplotlib et Seaborn proposent des outils puissants pour créer et personnaliser des box plots, offrant une représentation claire et synthétique des caractéristiques principales d’un jeu de données.
Cette section vous expliquera comment utiliser les boîtes à moustaches pour enrichir vos analyses statistiques.
Fonctions :
-
plt.boxplot()
La fonction plt.boxplot() permet de créer un graphique en boîte (boxplot), utilisé pour afficher la distribution d'un jeu de données, en montrant ses quartiles, ainsi que les valeurs extrêmes et les éventuelles valeurs aberrantes.
Importation :
import matplotlib.pyplot as plt
Attributs :
Paramètre Type Description Valeur par défaut x
array-like Les données à représenter sous forme de boîte (ex : une liste ou un tableau de données numériques). None
vert
bool Indique si la boîte doit être tracée verticalement (True) ou horizontalement (False). True
patch_artist
bool Si True, les boîtes seront remplies avec des couleurs. False
notch
bool Si True, le graphique en boîte sera "entailleur" pour montrer l'intervalle interquartile. False
whis
float / str Proportion de l'intervalle interquartile (ex : 1.5 pour les valeurs extrêmes), ou 'range' pour utiliser toute l'étendue des données. 1.5
showmeans
bool Si True, le graphique affichera la moyenne des données. False
Exemple de code :
import matplotlib.pyplot as plt import numpy as np # Données à afficher dans un boxplot data = np.random.normal(loc=0, scale=1, size=100) # Création du boxplot plt.boxplot(data, vert=True, patch_artist=True, notch=True, whis=1.5, showmeans=True) # Ajouter un titre et afficher le graphique plt.title("Exemple de Boxplot") plt.show()