Conversion en format datetime

La conversion en format datetime avec pd.to_datetime(df[‘date’]) permet de transformer une colonne de dates au format texte (chaîne de caractères) en un format de date et heure utilisable par Pandas. Cela permet de profiter des fonctionnalités et des méthodes de gestion de dates et d’heures (comme l’extraction d’années, mois, jours, etc.) pour effectuer des opérations chronologiques sur les données. Cette méthode gère automatiquement différents formats de dates et permet une manipulation plus précise des données temporelles.

Fonctions :

  • pd.to_datetime(df['date'])

    La fonction pd.to_datetime() permet de convertir une colonne (ou une série) de dates sous forme de chaînes de caractères en un format de date et heure (datetime) utilisable dans un DataFrame Pandas. Cette conversion est essentielle pour effectuer des opérations de manipulation et d'analyse sur les données temporelles, comme le filtrage par date, la rééchantillonnage, ou la comparaison des dates.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    arg La série ou la colonne contenant les données à convertir. Cela peut être une liste, un tableau NumPy, ou une série Pandas avec des chaînes de caractères représentant des dates.
    format Permet de spécifier le format des dates dans les chaînes (par exemple, '%Y-%m-%d' pour 2025-03-09). Cela peut accélérer la conversion.
    errors Spécifie comment gérer les erreurs. Par défaut ('raise'), les erreurs lèveront une exception. Vous pouvez aussi spécifier 'coerce' pour transformer les erreurs en NaT (Not a Time), ou 'ignore' pour laisser les erreurs inchangées.
    dayfirst Si True, les dates sont interprétées avec le jour avant le mois (utile pour les formats de date européens).
    utc Si True, convertit les dates en temps UTC.

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrame avec des dates sous forme de chaînes
    df = pd.DataFrame({
        'date': ['2023-01-01', '2023-05-12', '2023-09-30']
    })
    
    # Conversion de la colonne 'date' en format datetime
    df['date'] = pd.to_datetime(df['date'])
    
    # Affichage du DataFrame après conversion
    print(df)
    Résultat du code

    Explication du code :

    La ligne import pandas as pd importe la bibliothèque pandas, renommée ici en pd pour faciliter son utilisation dans le code.

    Exemple de DataFrame avec des dates sous forme de chaînes

    Un DataFrame nommé df est créé avec une colonne date contenant des dates sous forme de chaînes (strings).

    Conversion de la colonne 'date' en format datetime

    La méthode pd.to_datetime() permet de convertir une colonne contenant des chaînes représentant des dates en un format datetime que pandas peut manipuler de manière plus efficace pour effectuer des calculs sur les dates.

    Dans ce cas, la colonne date est convertie du format chaîne au format datetime, ce qui permet de mieux traiter les données temporelles.

    Affichage du DataFrame après conversion

    Le DataFrame après conversion est affiché, où la colonne date est désormais au format datetime, ce qui facilite le traitement et les opérations sur les dates.