Créer un tableau croisé dynamique

Le tableau croisé dynamique est un outil puissant d’analyse de données qui permet de résumer et d’organiser les informations en croisant deux ou plusieurs variables. Il facilite la synthèse des données en regroupant, filtrant et agrégant les valeurs selon différentes dimensions, offrant ainsi une vue claire des relations entre variables. Cet outil est particulièrement utile pour détecter des tendances, comparer des catégories et réaliser des analyses multidimensionnelles de manière interactive.

Fonctions :

  • pivot_table()

    La fonction pivot_table() permet de créer un tableau croisé dynamique dans un DataFrame, où les valeurs d'une ou plusieurs colonnes sont agrégées selon les combinaisons d'index et de colonnes spécifiées. Cela permet de résumer et d'analyser facilement des données, en utilisant des fonctions d'agrégation telles que la moyenne, la somme, le minimum, le maximum, etc.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Type Description Valeur par défaut
    index str ou list La colonne (ou les colonnes) à utiliser comme index du tableau croisé. None
    columns str ou list La colonne (ou les colonnes) à utiliser comme colonnes du tableau croisé. None
    values str La colonne contenant les valeurs numériques à agréger. None
    aggfunc str ou function La fonction d'agrégation à appliquer aux valeurs. Exemple : 'mean', 'sum', 'min', 'max', etc. 'mean'

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrame
    data = {
        'produit': ['A', 'B', 'A', 'C', 'B', 'C', 'A'],
        'mois': ['Jan', 'Jan', 'Feb', 'Feb', 'Mar', 'Mar', 'Jan'],
        'ventes': [100, 150, 200, 250, 300, 350, 400]
    }
    df = pd.DataFrame(data)
    
    # Créer un tableau croisé dynamique
    pivot = df.pivot_table(index='mois', columns='produit', values='ventes', aggfunc='sum')
    
    print("Tableau croisé dynamique des ventes :")
    print(pivot)
    Résultat du code

    Explication du code :

    import pandas as pd importe la bibliothèque pandas, renommée ici en pd pour simplifier son utilisation dans le code.

    Exemple de DataFrame

    Le dictionnaire data contient trois clés : 'produit', 'mois', et 'ventes', chacune associée à une liste de valeurs. Ce dictionnaire est utilisé pour créer un DataFrame df.

    Créer un tableau croisé dynamique

    La méthode pivot_table() est utilisée pour créer un tableau croisé dynamique à partir du DataFrame. Elle permet de résumer les données en fonction de certaines catégories. Dans ce cas, les données sont regroupées par mois (via index='mois') et par produit (via columns='produit'). La somme des ventes est calculée pour chaque combinaison de mois et de produit, grâce à values='ventes' et aggfunc='sum', ce qui agrège les ventes pour chaque groupe.

    Le résultat est assigné à la variable pivot, qui contient le tableau croisé dynamique des ventes.

    Enfin, print(pivot) affiche le tableau croisé dynamique, montrant la somme des ventes pour chaque produit et mois.