Concaténation horizontale de DataFrames

La concaténation horizontale de DataFrames avec concat et axis=1 permet de combiner plusieurs DataFrames en un seul en ajoutant des colonnes les unes à côté des autres. Cela signifie que les colonnes des différents DataFrames seront alignées, créant ainsi un DataFrame plus large. axis=1 indique que la concaténation se fait le long de l’axe des colonnes (par opposition à l’axe des lignes). Si les DataFrames ont des index différents, les lignes seront alignées en fonction de leur index respectif. Si certains index sont manquants, des valeurs NaN seront insérées pour ces lignes. Cette technique est particulièrement utile lorsque vous avez des informations complémentaires dans plusieurs DataFrames et que vous souhaitez les fusionner côte à côte.

Fonctions :

  • concat(axis=1)

    La fonction pd.concat() permet de concaténer plusieurs DataFrames, et lorsque l'argument axis=1 est utilisé, cela signifie que les DataFrames sont concaténés horizontalement, c'est-à-dire que les colonnes des DataFrames sont fusionnées côte à côte. Ce type de concaténation est utile lorsqu'on souhaite ajouter de nouvelles colonnes provenant de différents DataFrames à un DataFrame existant.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    axis=1 Concaténer les DataFrames horizontalement (par colonne).
    ignore_index=False Les index des lignes des DataFrames originaux sont conservés.
    keys Crée une hiérarchie d'index avec une clé pour chaque DataFrame.
    join='inner' ou join='outer' Détermine la manière dont les lignes des DataFrames sont fusionnées. 'inner' conserve les lignes communes, tandis que 'outer' garde toutes les lignes (avec des valeurs manquantes pour celles qui n'ont pas de correspondance).

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrames
    df1 = pd.DataFrame({
        'A': [1, 2, 3],
        'B': ['a', 'b', 'c']
    })
    
    df2 = pd.DataFrame({
        'C': [4, 5, 6],
        'D': ['d', 'e', 'f']
    })
    
    # Concaténation horizontale des DataFrames
    df_concat = pd.concat([df1, df2], axis=1)
    
    # Affichage du DataFrame concaténé
    print(df_concat)
    Résultat du code

    Explication du code :

    Importation de la bibliothèque

    import pandas as pd

    Cette ligne importe la bibliothèque pandas sous l’alias pd, facilitant ainsi son usage dans le reste du code.

    Création des DataFrames

    df1 = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] })

    Ce DataFrame df1 contient deux colonnes : A avec des entiers, et B avec des chaînes de caractères.

    df2 = pd.DataFrame({ 'C': [4, 5, 6], 'D': ['d', 'e', 'f'] })

    Le second DataFrame df2 possède également deux colonnes, mais avec des noms différents : C et D.

    Concaténation horizontale des DataFrames

    df_concat = pd.concat([df1, df2], axis=1)

    La fonction pd.concat() permet de fusionner plusieurs DataFrames.

    Le paramètre axis=1 indique une concaténation horizontale, c’est-à-dire une fusion par les colonnes.

    Les colonnes de df2 sont ainsi ajoutées à droite de celles de df1, ligne par ligne.

    Affichage du DataFrame concaténé

    print(df_concat)

    Cette instruction affiche le DataFrame final, contenant les colonnes de df1 et de df2 côte à côte.