Exporter un DataFrame en JSON avec to_json()
La méthode to_json() de Pandas permet d’exporter un DataFrame sous forme de fichier JSON. Elle peut être utilisée pour convertir les données tabulaires en format JSON pour une meilleure compatibilité avec des applications web ou des systèmes utilisant ce format.
Fonctions :
-
to_json()
La méthode to_json() de pandas permet d'exporter un DataFrame vers un fichier JSON. L'argument orient='records' permet de spécifier que chaque ligne du DataFrame sera convertie en un objet JSON distinct, tandis que lines=True permet d'enregistrer chaque objet JSON sur une ligne séparée dans le fichier. Cela rend le fichier plus lisible et facilement exploitable par des systèmes qui traitent des objets JSON ligne par ligne.
Importation :
import pandas as pd
Attributs :
Paramètre Description path_or_buffer
Le chemin du fichier JSON où les données seront sauvegardées (peut être un chemin de fichier ou un buffer). orient
Détermine la structure du fichier JSON. Les options incluent : records
,split
,index
, etc.lines
Si True
, chaque enregistrement est écrit sur une ligne séparée. Utilisé avecorient='records'
.index
Si True
, l'index sera inclus dans le fichier JSON (par défautTrue
).date_format
Le format des dates dans le fichier JSON (par exemple, 'epoch'
,'iso'
, etc.).default_handler
Fonction appelée pour sérialiser les objets non JSON-encodables. Exemple de code :
import pandas as pd # Exemple de DataFrame data = {'Nom': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]} df = pd.DataFrame(data) # Exporter le DataFrame en JSON avec `orient='records'` et `lines=True` df.to_json('utilisateurs.json', orient='records', lines=True)
Explication du code :
- Un DataFrame
df
est créé à partir d'un dictionnaire contenant des noms et des âges. - La méthode
to_json()
est utilisée pour exporter ce DataFrame dans un fichier JSON avec les optionsorient='records'
etlines=True
. Cela garantit que chaque ligne du DataFrame sera convertie en un objet JSON individuel, et chaque objet sera écrit sur une ligne séparée dans le fichier JSON.
Remarque :
- Format
'records'
etlines=True
: Lorsque vous utilisezorient='records'
etlines=True
, le fichier JSON est écrit sous la forme de multiples objets JSON, un par ligne. Cela est particulièrement utile pour l'importation ou l'exportation de données vers des systèmes qui traitent chaque objet individuellement, comme les bases de données NoSQL ou certains services de streaming de données.
Conseils supplémentaires :
- Sérialisation de Dates : Si votre DataFrame contient des objets de type
datetime
, vous pouvez utiliser l'argumentdate_format='iso'
pour les sérialiser dans un format lisible comme ISO 8601.
- Un DataFrame