Concaténation horizontale de DataFrames
La concaténation horizontale de DataFrames avec concat et axis=1 permet de combiner plusieurs DataFrames en un seul en ajoutant des colonnes les unes à côté des autres. Cela signifie que les colonnes des différents DataFrames seront alignées, créant ainsi un DataFrame plus large. axis=1 indique que la concaténation se fait le long de l’axe des colonnes (par opposition à l’axe des lignes). Si les DataFrames ont des index différents, les lignes seront alignées en fonction de leur index respectif. Si certains index sont manquants, des valeurs NaN seront insérées pour ces lignes. Cette technique est particulièrement utile lorsque vous avez des informations complémentaires dans plusieurs DataFrames et que vous souhaitez les fusionner côte à côte.
Fonctions :
-
concat(axis=1)
La fonction pd.concat() permet de concaténer plusieurs DataFrames, et lorsque l'argument axis=1 est utilisé, cela signifie que les DataFrames sont concaténés horizontalement, c'est-à-dire que les colonnes des DataFrames sont fusionnées côte à côte. Ce type de concaténation est utile lorsqu'on souhaite ajouter de nouvelles colonnes provenant de différents DataFrames à un DataFrame existant.
Importation :
import pandas as pd
Attributs :
Paramètre Description axis=1
Concaténer les DataFrames horizontalement (par colonne). ignore_index=False
Les index des lignes des DataFrames originaux sont conservés. keys
Crée une hiérarchie d'index avec une clé pour chaque DataFrame. join='inner'
oujoin='outer'
Détermine la manière dont les lignes des DataFrames sont fusionnées. 'inner'
conserve les lignes communes, tandis que'outer'
garde toutes les lignes (avec des valeurs manquantes pour celles qui n'ont pas de correspondance).Exemple de code :
import pandas as pd # Exemple de DataFrames df1 = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] }) df2 = pd.DataFrame({ 'C': [4, 5, 6], 'D': ['d', 'e', 'f'] }) # Concaténation horizontale des DataFrames df_concat = pd.concat([df1, df2], axis=1) # Affichage du DataFrame concaténé print(df_concat)
Explication du code :
Importation de la bibliothèque
import pandas as pd
Cette ligne importe la bibliothèque
pandas
sous l’aliaspd
, facilitant ainsi son usage dans le reste du code.Création des DataFrames
df1 = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] })
Ce DataFrame
df1
contient deux colonnes :A
avec des entiers, etB
avec des chaînes de caractères.df2 = pd.DataFrame({ 'C': [4, 5, 6], 'D': ['d', 'e', 'f'] })
Le second DataFrame
df2
possède également deux colonnes, mais avec des noms différents :C
etD
.Concaténation horizontale des DataFrames
df_concat = pd.concat([df1, df2], axis=1)
La fonction
pd.concat()
permet de fusionner plusieurs DataFrames.Le paramètre
axis=1
indique une concaténation horizontale, c’est-à-dire une fusion par les colonnes.Les colonnes de
df2
sont ainsi ajoutées à droite de celles dedf1
, ligne par ligne.Affichage du DataFrame concaténé
print(df_concat)
Cette instruction affiche le DataFrame final, contenant les colonnes de
df1
et dedf2
côte à côte.