Histogramme (2D)
L’histogramme en deux dimensions (2D) est une extension de l’histogramme classique qui permet de représenter la distribution conjointe de deux variables continues. Il découpe l’espace des données en cellules (ou « bins ») selon les valeurs de chaque variable, et affiche la fréquence ou la densité des observations dans chaque cellule à l’aide de couleurs ou de hauteurs de barres.
Cet outil est particulièrement utile pour :
- Analyser la densité et la répartition des données dans un espace bidimensionnel,
- Détecter des regroupements, tendances, ou zones vides dans les données,
- Comprendre les interactions ou dépendances entre deux variables,
- Compléter l’analyse visuelle d’un nuage de points en fournissant une information de densité.
Les histogrammes 2D peuvent être représentés sous forme de cartes de chaleur (« heatmaps ») ou de surfaces en relief, facilitant l’interprétation visuelle des concentrations de données dans l’espace.
En résumé, l’histogramme 2D est un outil puissant pour explorer les relations complexes entre deux variables numériques en visualisant simultanément leur distribution conjointe.
Fonctions :
-
px.histogram()
px.histogram() crée un histogramme interactif permettant de visualiser la distribution d’une variable numérique ou catégorielle. Il regroupe les données en "buckets" (bacs) et affiche la fréquence ou la somme des valeurs dans chaque bac.
Importation :
import pandas as pd import plotly.express as pxAttributs :
Paramètre Type Description Valeur par défaut data_frameDataFrame Tableau de données source. Obligatoire xstr Nom de la colonne à distribuer en histogramme (axe des x). Obligatoire ystr Colonne utilisée pour agrégation des valeurs (optionnel). Nonecolorstr Colonne utilisée pour colorer les barres selon une catégorie. Nonenbinsint Nombre de bacs (bins) pour répartir les données numériques. Autobarmodestr Mode d’affichage : 'group','stack','overlay'.'relative'titlestr Titre du graphique. NoneExemple de code :
import pandas as pd import plotly.express as px # Création d'un DataFrame data = { 'Âge': [23, 45, 56, 23, 35, 45, 67, 34, 25, 40, 29, 50] } df = pd.DataFrame(data) # Création de l'histogramme fig = px.histogram(df, x='Âge', nbins=5, title="Distribution des âges") # Affichage fig.show()Explication du code :
importe les bibliothèques pandas et plotly.express.
Création du DataFrame
Le dictionnairedatacontient une seule colonne'Âge'avec des valeurs numériques.df = pd.DataFrame(data)transforme ce dictionnaire en tableau de données.Création de l'histogramme
px.histogram(...)crée un graphique interactif affichant la répartition des âges : -x='Âge'pour la variable à distribuer, -nbins=5pour répartir les données en 5 bacs, -title="Distribution des âges"pour le titre du graphique.Affichage
fig.show()affiche le graphique.