Histogramme (2D)
L’histogramme en deux dimensions (2D) est une extension de l’histogramme classique qui permet de représenter la distribution conjointe de deux variables continues. Il découpe l’espace des données en cellules (ou « bins ») selon les valeurs de chaque variable, et affiche la fréquence ou la densité des observations dans chaque cellule à l’aide de couleurs ou de hauteurs de barres.
Cet outil est particulièrement utile pour :
- Analyser la densité et la répartition des données dans un espace bidimensionnel,
- Détecter des regroupements, tendances, ou zones vides dans les données,
- Comprendre les interactions ou dépendances entre deux variables,
- Compléter l’analyse visuelle d’un nuage de points en fournissant une information de densité.
Les histogrammes 2D peuvent être représentés sous forme de cartes de chaleur (« heatmaps ») ou de surfaces en relief, facilitant l’interprétation visuelle des concentrations de données dans l’espace.
En résumé, l’histogramme 2D est un outil puissant pour explorer les relations complexes entre deux variables numériques en visualisant simultanément leur distribution conjointe.
Fonctions :
-
px.histogram()
px.histogram() crée un histogramme interactif permettant de visualiser la distribution d’une variable numérique ou catégorielle. Il regroupe les données en "buckets" (bacs) et affiche la fréquence ou la somme des valeurs dans chaque bac.
Importation :
import pandas as pd import plotly.express as px
Attributs :
Paramètre Type Description Valeur par défaut data_frame
DataFrame Tableau de données source. Obligatoire x
str Nom de la colonne à distribuer en histogramme (axe des x). Obligatoire y
str Colonne utilisée pour agrégation des valeurs (optionnel). None
color
str Colonne utilisée pour colorer les barres selon une catégorie. None
nbins
int Nombre de bacs (bins) pour répartir les données numériques. Auto
barmode
str Mode d’affichage : 'group'
,'stack'
,'overlay'
.'relative'
title
str Titre du graphique. None
Exemple de code :
import pandas as pd import plotly.express as px # Création d'un DataFrame data = { 'Âge': [23, 45, 56, 23, 35, 45, 67, 34, 25, 40, 29, 50] } df = pd.DataFrame(data) # Création de l'histogramme fig = px.histogram(df, x='Âge', nbins=5, title="Distribution des âges") # Affichage fig.show()
Explication du code :
importe les bibliothèques pandas et plotly.express.
Création du DataFrame
Le dictionnairedata
contient une seule colonne'Âge'
avec des valeurs numériques.df = pd.DataFrame(data)
transforme ce dictionnaire en tableau de données.Création de l'histogramme
px.histogram(...)
crée un graphique interactif affichant la répartition des âges : -x='Âge'
pour la variable à distribuer, -nbins=5
pour répartir les données en 5 bacs, -title="Distribution des âges"
pour le titre du graphique.Affichage
fig.show()
affiche le graphique.