Concaténation verticale de DataFrames
La concaténation verticale de DataFrames avec concat et axis=0 permet d’assembler plusieurs DataFrames en un seul, en empilant les lignes les unes sur les autres. Cela signifie que les lignes de chaque DataFrame seront ajoutées à la suite des autres, formant un DataFrame plus grand. axis=0 indique que la concaténation se fait le long de l’axe des lignes (par opposition à l’axe des colonnes). Les DataFrames doivent avoir les mêmes colonnes pour que la concaténation soit réussie, sinon des colonnes manquantes seront remplies avec des valeurs NaN. Cela est utile lorsque vous avez plusieurs jeux de données structurés de manière identique et que vous souhaitez les fusionner en une seule table.
Fonctions :
-
concat(axis=0)
La fonction pd.concat() permet de concaténer plusieurs DataFrames le long d'un axe donné. Lorsqu'on utilise axis=0, cela signifie que les DataFrames sont concaténés verticalement, c'est-à-dire que les lignes des DataFrames sont empilées les unes sur les autres. Ce type de concaténation est souvent utilisé lorsque vous voulez fusionner plusieurs jeux de données ayant les mêmes colonnes.
Importation :
import pandas as pd
Attributs :
Paramètre Description axis=0
Concaténer les DataFrames verticalement (par ligne). ignore_index=True
Réindexer les lignes après la concaténation (utile pour éviter des index dupliqués). keys
Créer une hiérarchie d'index avec une clé pour chaque DataFrame. join='inner'
oujoin='outer'
Détermine la manière dont les colonnes des DataFrames sont fusionnées. 'inner'
ne conserve que les colonnes communes, tandis que'outer'
garde toutes les colonnes (valeurs manquantes où il n'y a pas de correspondance).Exemple de code :
import pandas as pd # Exemple de DataFrames df1 = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] }) df2 = pd.DataFrame({ 'A': [4, 5, 6], 'B': ['d', 'e', 'f'] }) # Concaténation verticale des DataFrames df_concat = pd.concat([df1, df2], axis=0) # Affichage du DataFrame concaténé print(df_concat)
Explication du code :
Importation de la bibliothèque
import pandas as pd
Cette ligne importe la bibliothèque
pandas
sous l’aliaspd
afin de faciliter son utilisation dans le code.Création des DataFrames
df1 = pd.DataFrame({ 'A': [1, 2, 3], 'B': ['a', 'b', 'c'] })
Ce DataFrame nommé
df1
contient deux colonnes : une colonneA
avec des entiers et une colonneB
avec des chaînes de caractères.df2 = pd.DataFrame({ 'A': [4, 5, 6], 'B': ['d', 'e', 'f'] })
Ce second DataFrame
df2
a la même structure quedf1
mais avec des données différentes.Concaténation verticale des DataFrames
df_concat = pd.concat([df1, df2], axis=0)
La fonction
pd.concat()
permet de concaténer plusieurs DataFrames.Le paramètre
axis=0
indique une concaténation verticale (ajout des lignes).Les lignes de
df2
sont donc ajoutées à la suite de celles dedf1
, formant un nouveau DataFramedf_concat
.Affichage du DataFrame concaténé
print(df_concat)
Cette ligne affiche le résultat de la concaténation, montrant les lignes des deux DataFrames réunies dans un seul tableau.