Création d'un MultiIndex avec pd.MultiIndex.from_tuples() (
La création d’un MultiIndex avec pd.MultiIndex.from_tuples() permet de définir un index hiérarchique pour un DataFrame ou une Series à partir d’une liste de tuples. Chaque tuple représente un ensemble de valeurs pour chaque niveau de l’index, permettant de structurer les données de manière plus complexe et de faciliter des opérations telles que le regroupement ou la manipulation sur plusieurs niveaux d’indexation.
Fonctions :
-
pd.MultiIndex.from_tuples()
La fonction pd.MultiIndex.from_tuples() permet de créer un objet MultiIndex à partir d'une liste de tuples. Un MultiIndex est une structure de données qui permet de gérer des index hiérarchiques, c'est-à-dire des index à plusieurs niveaux. Cela est utile lorsqu'on travaille avec des données multidimensionnelles et qu'on souhaite indexer les données selon plusieurs critères. Dans ce cas, chaque tuple représente une combinaison de niveaux d'index et l'argument names permet de donner un nom à chaque niveau de l'index. Cela rend l'index plus explicite et facilite la manipulation des données par la suite.
Importation :
import pandas as pd
Attributs :
Paramètre Description tuples
Liste de tuples représentant les différentes combinaisons d'index. Chaque tuple correspond à un ensemble de valeurs pour les niveaux de l'index. names
Liste de chaînes de caractères représentant les noms des différents niveaux d'index. Cela est optionnel, mais il est recommandé pour rendre l'index plus lisible. Exemple de code :
import pandas as pd # Création d'un MultiIndex à partir de tuples multi_index = pd.MultiIndex.from_tuples([('A', 1), ('A', 2), ('B', 1)], names=['lettre', 'num']) # Création d'un DataFrame avec ce MultiIndex df = pd.DataFrame({'valeur': [10, 20, 30]}, index=multi_index) # Affichage du DataFrame print(df)
Explication du code :
import pandas as pd
importe la bibliothèque pandas, renommée enpd
.Création d'un MultiIndex à partir de tuples
Un MultiIndex est créé en utilisant la fonction
pd.MultiIndex.from_tuples()
. Il prend une liste de tuples comme argument. Chaque tuple représente un ensemble de valeurs qui seront utilisées comme indices dans le DataFrame. Dans cet exemple, le MultiIndex contient deux niveaux :'lettre'
et'num'
, avec les valeurs suivantes :('A', 1)
('A', 2)
('B', 1)
Les noms des niveaux de l'index sont définis avec
names=['lettre', 'num']
.Création du DataFrame avec ce MultiIndex
Un DataFrame est créé avec une seule colonne nommée
'valeur'
, et une série de valeurs associées (10, 20, 30). Ce DataFrame utilise le MultiIndex créé précédemment comme index. Le DataFrame a donc trois lignes, où chaque ligne a un indice composé de deux éléments : une lettre et un nombre.Affichage du DataFrame
Le DataFrame est ensuite affiché, et il ressemble à ceci :
valeur lettre num A 1 10 2 20 B 1 30
Ce DataFrame est organisé avec un index hiérarchique, ce qui permet de référencer les données de manière plus détaillée et structurée.