Exporter un DataFrame en JSON avec to_json()

La méthode to_json() de Pandas permet d’exporter un DataFrame sous forme de fichier JSON. Elle peut être utilisée pour convertir les données tabulaires en format JSON pour une meilleure compatibilité avec des applications web ou des systèmes utilisant ce format.

Fonctions :

  • to_json()

    La méthode to_json() de pandas permet d'exporter un DataFrame vers un fichier JSON. L'argument orient='records' permet de spécifier que chaque ligne du DataFrame sera convertie en un objet JSON distinct, tandis que lines=True permet d'enregistrer chaque objet JSON sur une ligne séparée dans le fichier. Cela rend le fichier plus lisible et facilement exploitable par des systèmes qui traitent des objets JSON ligne par ligne.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    path_or_buffer Le chemin du fichier JSON où les données seront sauvegardées (peut être un chemin de fichier ou un buffer).
    orient Détermine la structure du fichier JSON. Les options incluent : records, split, index, etc.
    lines Si True, chaque enregistrement est écrit sur une ligne séparée. Utilisé avec orient='records'.
    index Si True, l'index sera inclus dans le fichier JSON (par défaut True).
    date_format Le format des dates dans le fichier JSON (par exemple, 'epoch', 'iso', etc.).
    default_handler Fonction appelée pour sérialiser les objets non JSON-encodables.

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrame
    data = {'Nom': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
    df = pd.DataFrame(data)
    
    # Exporter le DataFrame en JSON avec `orient='records'` et `lines=True`
    df.to_json('utilisateurs.json', orient='records', lines=True)

    Explication du code :

    1. Un DataFrame df est créé à partir d'un dictionnaire contenant des noms et des âges.
    2. La méthode to_json() est utilisée pour exporter ce DataFrame dans un fichier JSON avec les options orient='records' et lines=True. Cela garantit que chaque ligne du DataFrame sera convertie en un objet JSON individuel, et chaque objet sera écrit sur une ligne séparée dans le fichier JSON.

    Remarque :

    • Format 'records' et lines=True : Lorsque vous utilisez orient='records' et lines=True, le fichier JSON est écrit sous la forme de multiples objets JSON, un par ligne. Cela est particulièrement utile pour l'importation ou l'exportation de données vers des systèmes qui traitent chaque objet individuellement, comme les bases de données NoSQL ou certains services de streaming de données.

    Conseils supplémentaires :

    • Sérialisation de Dates : Si votre DataFrame contient des objets de type datetime, vous pouvez utiliser l'argument date_format='iso' pour les sérialiser dans un format lisible comme ISO 8601.