Concaténation verticale de DataFrames
La concaténation verticale de DataFrames avec concat et axis=0 permet d’assembler plusieurs DataFrames en un seul, en empilant les lignes les unes sur les autres. Cela signifie que les lignes de chaque DataFrame seront ajoutées à la suite des autres, formant un DataFrame plus grand. axis=0 indique que la concaténation se fait le long de l’axe des lignes (par opposition à l’axe des colonnes). Les DataFrames doivent avoir les mêmes colonnes pour que la concaténation soit réussie, sinon des colonnes manquantes seront remplies avec des valeurs NaN. Cela est utile lorsque vous avez plusieurs jeux de données structurés de manière identique et que vous souhaitez les fusionner en une seule table.
Fonctions :
-
concat(axis=0)
La fonction pd.concat() permet de concaténer plusieurs DataFrames le long d'un axe donné. Lorsqu'on utilise axis=0, cela signifie que les DataFrames sont concaténés verticalement, c'est-à-dire que les lignes des DataFrames sont empilées les unes sur les autres. Ce type de concaténation est souvent utilisé lorsque vous voulez fusionner plusieurs jeux de données ayant les mêmes colonnes.
Importation :
import pandas as pdAttributs :
Paramètre Description axis=0Concaténer les DataFrames verticalement (par ligne). ignore_index=TrueRéindexer les lignes après la concaténation (utile pour éviter des index dupliqués). keysCréer une hiérarchie d'index avec une clé pour chaque DataFrame. join='inner'oujoin='outer'Détermine la manière dont les colonnes des DataFrames sont fusionnées. 'inner'ne conserve que les colonnes communes, tandis que'outer'garde toutes les colonnes (valeurs manquantes où il n'y a pas de correspondance).Exemple de code :
import pandas as pd # Exemple de DataFrames df1 = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] }) df2 = pd.DataFrame({ 'A': [4, 5, 6], 'B': ['d', 'e', 'f'] }) # Concaténation verticale des DataFrames df_concat = pd.concat([df1, df2], axis=0) # Affichage du DataFrame concaténé print(df_concat)
Explication du code :
Importation de la bibliothèque
import pandas as pdCette ligne importe la bibliothèque
pandassous l’aliaspdafin de faciliter son utilisation dans le code.Création des DataFrames
df1 = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] })Ce DataFrame nommé
df1contient deux colonnes : une colonneAavec des entiers et une colonneBavec des chaînes de caractères.df2 = pd.DataFrame({ 'A': [4, 5, 6], 'B': ['d', 'e', 'f'] })Ce second DataFrame
df2a la même structure quedf1mais avec des données différentes.Concaténation verticale des DataFrames
df_concat = pd.concat([df1, df2], axis=0)La fonction
pd.concat()permet de concaténer plusieurs DataFrames.Le paramètre
axis=0indique une concaténation verticale (ajout des lignes).Les lignes de
df2sont donc ajoutées à la suite de celles dedf1, formant un nouveau DataFramedf_concat.Affichage du DataFrame concaténé
print(df_concat)Cette ligne affiche le résultat de la concaténation, montrant les lignes des deux DataFrames réunies dans un seul tableau.