Export en CSV, JSON, Excel, Parquet
L’exportation des données vers différents formats est essentielle pour partager, stocker ou analyser les informations dans divers outils. Pandas offre plusieurs méthodes simples et efficaces pour exporter des DataFrames vers des formats courants comme CSV, JSON, Excel ou Parquet. Ce chapitre explore ces méthodes et vous guide à travers les différentes options disponibles pour personnaliser vos exports.
Ce que vous allez apprendre dans cette section :
-
Exporter un DataFrame en CSV avec
to_csv()
La méthodeto_csv()
permet d’exporter un DataFrame au format CSV, qui est largement utilisé pour le stockage et l’échange de données tabulaires. Vous apprendrez à spécifier le chemin du fichier, le séparateur et d’autres options comme l’encodage. -
Exporter un DataFrame en CSV sans index avec
to_csv()
Par défaut,to_csv()
inclut l’index du DataFrame dans le fichier CSV. Découvrez comment l’ignorer pour ne sauvegarder que les colonnes de données. -
Exporter un DataFrame en JSON avec
to_json()
to_json()
est une méthode puissante pour exporter des données en format JSON, idéal pour les applications web et l’échange de données entre systèmes. Vous apprendrez à personnaliser la structure du JSON, comme l’orientation des données et la gestion des lignes. -
Exporter un DataFrame en JSON avec différentes options (
orient
etlines
)
Explorez les différentes options d’exportation pour JSON, telles queorient
, qui vous permet de choisir la disposition des données (par exemple, « records », « split », « index », etc.), etlines
, pour produire un JSON ligne par ligne. -
Exporter un DataFrame en Excel avec
to_excel()
to_excel()
vous permet d’exporter facilement un DataFrame au format Excel. Découvrez comment spécifier le nom du fichier, le type de feuille de calcul et d’autres options comme l’écriture avec ou sans l’index. -
Exporter un DataFrame en Excel avec plusieurs feuilles (
sheet_name
)
Vous apprendrez comment exporter un DataFrame vers un fichier Excel contenant plusieurs feuilles, chacune avec des données différentes.sheet_name
vous permet de spécifier les noms des feuilles. -
Exporter un DataFrame en Parquet avec
to_parquet()
Le format Parquet est optimisé pour les données volumineuses et complexes.to_parquet()
est utilisé pour enregistrer des données au format Parquet, qui est très efficace pour la lecture et l’écriture de gros volumes de données, tout en étant compatible avec de nombreuses technologies de Big Data. -
Exporter un DataFrame en Parquet avec compression (
compression='snappy'
)
Découvrez comment appliquer des techniques de compression à l’export Parquet pour réduire la taille du fichier, comme l’utilisation de la compression Snappy, qui est rapide et couramment utilisée dans le Big Data. -
Exporter un DataFrame avec des options supplémentaires (encodage, colonnes spécifiques, etc.)
Cette sous-section couvre les options avancées, telles que l’exportation de données avec un encodage spécifique, la sélection de colonnes à exporter, ou l’ajustement de délimiteurs dans le fichier CSV. -
Exporter un DataFrame en format HTML avec
to_html()
to_html()
permet d’exporter un DataFrame sous forme de tableau HTML. C’est utile pour visualiser les données dans une page web ou générer des rapports. Vous apprendrez à personnaliser l’apparence du tableau avec des options comme les classes CSS.
💡 L’exportation des données dans des formats variés est essentielle pour partager et analyser les informations avec différents outils, tout en offrant la flexibilité nécessaire pour s’adapter à divers cas d’utilisation.
Sous-sections du Chapitre
- Exporter un DataFrame en CSV avec to_csv()
- Exporter un DataFrame en CSV sans index avec to_csv()
- Exporter un DataFrame en JSON avec to_json()
- Exporter un DataFrame en JSON avec différentes options (orient et lines)
- Exporter un DataFrame en Excel avec to_excel()
- Exporter un DataFrame en Excel avec plusieurs feuilles (sheet_name)
- Exporter un DataFrame en Parquet avec to_parquet()
- Exporter un DataFrame en Parquet avec compression (compression=’snappy’)
- Exporter un DataFrame avec des options supplémentaires (encodage, colonnes spécifiques, etc.)
- Exporter un DataFrame en format HTML avec to_html()