Histogramme (2D)

L’histogramme en deux dimensions (2D) est une extension de l’histogramme classique qui permet de représenter la distribution conjointe de deux variables continues. Il découpe l’espace des données en cellules (ou « bins ») selon les valeurs de chaque variable, et affiche la fréquence ou la densité des observations dans chaque cellule à l’aide de couleurs ou de hauteurs de barres.

Cet outil est particulièrement utile pour :

Les histogrammes 2D peuvent être représentés sous forme de cartes de chaleur (« heatmaps ») ou de surfaces en relief, facilitant l’interprétation visuelle des concentrations de données dans l’espace.

En résumé, l’histogramme 2D est un outil puissant pour explorer les relations complexes entre deux variables numériques en visualisant simultanément leur distribution conjointe.

Fonctions :

  • px.histogram()

    px.histogram() crée un histogramme interactif permettant de visualiser la distribution d’une variable numérique ou catégorielle. Il regroupe les données en "buckets" (bacs) et affiche la fréquence ou la somme des valeurs dans chaque bac.

    Importation :

    import pandas as pd
    import plotly.express as px

    Attributs :

    Paramètre Type Description Valeur par défaut
    data_frame DataFrame Tableau de données source. Obligatoire
    x str Nom de la colonne à distribuer en histogramme (axe des x). Obligatoire
    y str Colonne utilisée pour agrégation des valeurs (optionnel). None
    color str Colonne utilisée pour colorer les barres selon une catégorie. None
    nbins int Nombre de bacs (bins) pour répartir les données numériques. Auto
    barmode str Mode d’affichage : 'group', 'stack', 'overlay'. 'relative'
    title str Titre du graphique. None

    Exemple de code :

    import pandas as pd
    import plotly.express as px
    
    # Création d'un DataFrame
    data = {
        'Âge': [23, 45, 56, 23, 35, 45, 67, 34, 25, 40, 29, 50]
    }
    
    df = pd.DataFrame(data)
    
    # Création de l'histogramme
    fig = px.histogram(df, x='Âge', nbins=5, title="Distribution des âges")
    
    # Affichage
    fig.show()
    Résultat du code

    Explication du code :

    importe les bibliothèques pandas et plotly.express.
    
    
    Création du DataFrame
    Le dictionnaire data contient une seule colonne 'Âge' avec des valeurs numériques. df = pd.DataFrame(data) transforme ce dictionnaire en tableau de données.
    Création de l'histogramme
    px.histogram(...) crée un graphique interactif affichant la répartition des âges : - x='Âge' pour la variable à distribuer, - nbins=5 pour répartir les données en 5 bacs, - title="Distribution des âges" pour le titre du graphique.
    Affichage
    fig.show() affiche le graphique.