Création d'un MultiIndex avec pd.MultiIndex.from_tuples() (

La création d’un MultiIndex avec pd.MultiIndex.from_tuples() permet de définir un index hiérarchique pour un DataFrame ou une Series à partir d’une liste de tuples. Chaque tuple représente un ensemble de valeurs pour chaque niveau de l’index, permettant de structurer les données de manière plus complexe et de faciliter des opérations telles que le regroupement ou la manipulation sur plusieurs niveaux d’indexation.

Fonctions :

  • pd.MultiIndex.from_tuples()

    La fonction pd.MultiIndex.from_tuples() permet de créer un objet MultiIndex à partir d'une liste de tuples. Un MultiIndex est une structure de données qui permet de gérer des index hiérarchiques, c'est-à-dire des index à plusieurs niveaux. Cela est utile lorsqu'on travaille avec des données multidimensionnelles et qu'on souhaite indexer les données selon plusieurs critères. Dans ce cas, chaque tuple représente une combinaison de niveaux d'index et l'argument names permet de donner un nom à chaque niveau de l'index. Cela rend l'index plus explicite et facilite la manipulation des données par la suite.

    Importation :

    import pandas as pd
    

    Attributs :

    Paramètre Description
    tuples Liste de tuples représentant les différentes combinaisons d'index. Chaque tuple correspond à un ensemble de valeurs pour les niveaux de l'index.
    names Liste de chaînes de caractères représentant les noms des différents niveaux d'index. Cela est optionnel, mais il est recommandé pour rendre l'index plus lisible.

    Exemple de code :

    import pandas as pd
    
    # Création d'un MultiIndex à partir de tuples
    multi_index = pd.MultiIndex.from_tuples([('A', 1), ('A', 2), ('B', 1)], names=['lettre', 'num'])
    
    # Création d'un DataFrame avec ce MultiIndex
    df = pd.DataFrame({'valeur': [10, 20, 30]}, index=multi_index)
    
    # Affichage du DataFrame
    print(df)
    Résultat du code

    Explication du code :

    import pandas as pd importe la bibliothèque pandas, renommée en pd.

    Création d'un MultiIndex à partir de tuples

    Un MultiIndex est créé en utilisant la fonction pd.MultiIndex.from_tuples(). Il prend une liste de tuples comme argument. Chaque tuple représente un ensemble de valeurs qui seront utilisées comme indices dans le DataFrame. Dans cet exemple, le MultiIndex contient deux niveaux : 'lettre' et 'num', avec les valeurs suivantes :

    • ('A', 1)
    • ('A', 2)
    • ('B', 1)

    Les noms des niveaux de l'index sont définis avec names=['lettre', 'num'].

    Création du DataFrame avec ce MultiIndex

    Un DataFrame est créé avec une seule colonne nommée 'valeur', et une série de valeurs associées (10, 20, 30). Ce DataFrame utilise le MultiIndex créé précédemment comme index. Le DataFrame a donc trois lignes, où chaque ligne a un indice composé de deux éléments : une lettre et un nombre.

    Affichage du DataFrame

    Le DataFrame est ensuite affiché, et il ressemble à ceci :

                valeur
    lettre num        
    A      1        10
           2        20
    B      1        30
    

    Ce DataFrame est organisé avec un index hiérarchique, ce qui permet de référencer les données de manière plus détaillée et structurée.