Créer un tableau croisé dynamique
Un tableau croisé dynamique (pivot table) permet de résumer et d’agréger des données en fonction de plusieurs dimensions. Avec la méthode pivot_table(), vous pouvez spécifier une ou plusieurs colonnes comme index, d’autres comme colonnes, et déterminer la valeur à agréger. Vous pouvez également choisir la fonction d’agrégation souhaitée (comme la moyenne, la somme, etc.) pour calculer les résultats. Cette méthode est utile pour explorer des relations entre différentes catégories et résumer de grandes quantités de données sous forme compacte et lisible.
Fonctions :
-
pivot_table()
La fonction pivot_table() permet de créer un tableau croisé dynamique dans un DataFrame, où les valeurs d'une ou plusieurs colonnes sont agrégées selon les combinaisons d'index et de colonnes spécifiées. Cela permet de résumer et d'analyser facilement des données, en utilisant des fonctions d'agrégation telles que la moyenne, la somme, le minimum, le maximum, etc.
Importation :
import pandas as pd
Attributs :
Paramètre Type Description Valeur par défaut index
str ou list La colonne (ou les colonnes) à utiliser comme index du tableau croisé. None
columns
str ou list La colonne (ou les colonnes) à utiliser comme colonnes du tableau croisé. None
values
str La colonne contenant les valeurs numériques à agréger. None
aggfunc
str ou function La fonction d'agrégation à appliquer aux valeurs. Exemple : 'mean'
,'sum'
,'min'
,'max'
, etc.'mean'
Exemple de code :
import pandas as pd # Exemple de DataFrame data = { 'produit': ['A', 'B', 'A', 'C', 'B', 'C', 'A'], 'mois': ['Jan', 'Jan', 'Feb', 'Feb', 'Mar', 'Mar', 'Jan'], 'ventes': [100, 150, 200, 250, 300, 350, 400] } df = pd.DataFrame(data) # Créer un tableau croisé dynamique pivot = df.pivot_table(index='mois', columns='produit', values='ventes', aggfunc='sum') print("Tableau croisé dynamique des ventes :") print(pivot)
Explication du code :
import pandas as pd
importe la bibliothèque pandas, renommée ici enpd
pour simplifier son utilisation dans le code.Exemple de DataFrame
Le dictionnaire
data
contient trois clés :'produit'
,'mois'
, et'ventes'
, chacune associée à une liste de valeurs. Ce dictionnaire est utilisé pour créer un DataFramedf
.Créer un tableau croisé dynamique
La méthode
pivot_table()
est utilisée pour créer un tableau croisé dynamique à partir du DataFrame. Elle permet de résumer les données en fonction de certaines catégories. Dans ce cas, les données sont regroupées par mois (viaindex='mois'
) et par produit (viacolumns='produit'
). La somme des ventes est calculée pour chaque combinaison de mois et de produit, grâce àvalues='ventes'
etaggfunc='sum'
, ce qui agrège les ventes pour chaque groupe.Le résultat est assigné à la variable
pivot
, qui contient le tableau croisé dynamique des ventes.Enfin,
print(pivot)
affiche le tableau croisé dynamique, montrant la somme des ventes pour chaque produit et mois.