Concaténation verticale de DataFrames

La concaténation verticale de DataFrames avec concat et axis=0 permet d’assembler plusieurs DataFrames en un seul, en empilant les lignes les unes sur les autres. Cela signifie que les lignes de chaque DataFrame seront ajoutées à la suite des autres, formant un DataFrame plus grand. axis=0 indique que la concaténation se fait le long de l’axe des lignes (par opposition à l’axe des colonnes). Les DataFrames doivent avoir les mêmes colonnes pour que la concaténation soit réussie, sinon des colonnes manquantes seront remplies avec des valeurs NaN. Cela est utile lorsque vous avez plusieurs jeux de données structurés de manière identique et que vous souhaitez les fusionner en une seule table.

Fonctions :

  • concat(axis=0)

    La fonction pd.concat() permet de concaténer plusieurs DataFrames le long d'un axe donné. Lorsqu'on utilise axis=0, cela signifie que les DataFrames sont concaténés verticalement, c'est-à-dire que les lignes des DataFrames sont empilées les unes sur les autres. Ce type de concaténation est souvent utilisé lorsque vous voulez fusionner plusieurs jeux de données ayant les mêmes colonnes.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    axis=0 Concaténer les DataFrames verticalement (par ligne).
    ignore_index=True Réindexer les lignes après la concaténation (utile pour éviter des index dupliqués).
    keys Créer une hiérarchie d'index avec une clé pour chaque DataFrame.
    join='inner' ou join='outer' Détermine la manière dont les colonnes des DataFrames sont fusionnées. 'inner' ne conserve que les colonnes communes, tandis que 'outer' garde toutes les colonnes (valeurs manquantes où il n'y a pas de correspondance).

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrames
    df1 = pd.DataFrame({
        'A': [1, 2, 3],
        'B': ['a', 'b', 'c']
    })
    
    df2 = pd.DataFrame({
        'A': [4, 5, 6],
        'B': ['d', 'e', 'f']
    })
    
    # Concaténation verticale des DataFrames
    df_concat = pd.concat([df1, df2], axis=0)
    
    # Affichage du DataFrame concaténé
    print(df_concat)
    Résultat du code

    Explication du code :

    Importation de la bibliothèque

    import pandas as pd

    Cette ligne importe la bibliothèque pandas sous l’alias pd afin de faciliter son utilisation dans le code.

    Création des DataFrames

    df1 = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] })

    Ce DataFrame nommé df1 contient deux colonnes : une colonne A avec des entiers et une colonne B avec des chaînes de caractères.

    df2 = pd.DataFrame({ 'A': [4, 5, 6], 'B': ['d', 'e', 'f'] })

    Ce second DataFrame df2 a la même structure que df1 mais avec des données différentes.

    Concaténation verticale des DataFrames

    df_concat = pd.concat([df1, df2], axis=0)

    La fonction pd.concat() permet de concaténer plusieurs DataFrames.

    Le paramètre axis=0 indique une concaténation verticale (ajout des lignes).

    Les lignes de df2 sont donc ajoutées à la suite de celles de df1, formant un nouveau DataFrame df_concat.

    Affichage du DataFrame concaténé

    print(df_concat)

    Cette ligne affiche le résultat de la concaténation, montrant les lignes des deux DataFrames réunies dans un seul tableau.