Conversion en format datetime

La conversion en format datetime avec pd.to_datetime(df[‘date’]) permet de transformer une colonne de dates au format texte (chaîne de caractères) en un format de date et heure utilisable par Pandas. Cela permet de profiter des fonctionnalités et des méthodes de gestion de dates et d’heures (comme l’extraction d’années, mois, jours, etc.) pour effectuer des opérations chronologiques sur les données. Cette méthode gère automatiquement différents formats de dates et permet une manipulation plus précise des données temporelles.

Fonctions :

  • pd.to_datetime(df['date'])

    La fonction pd.to_datetime() permet de convertir une colonne (ou une série) de dates sous forme de chaînes de caractères en un format de date et heure (datetime) utilisable dans un DataFrame Pandas. Cette conversion est essentielle pour effectuer des opérations de manipulation et d'analyse sur les données temporelles, comme le filtrage par date, la rééchantillonnage, ou la comparaison des dates.

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    arg La série ou la colonne contenant les données à convertir. Cela peut être une liste, un tableau NumPy, ou une série Pandas avec des chaînes de caractères représentant des dates.
    format Permet de spécifier le format des dates dans les chaînes (par exemple, '%Y-%m-%d' pour 2025-03-09). Cela peut accélérer la conversion.
    errors Spécifie comment gérer les erreurs. Par défaut ('raise'), les erreurs lèveront une exception. Vous pouvez aussi spécifier 'coerce' pour transformer les erreurs en NaT (Not a Time), ou 'ignore' pour laisser les erreurs inchangées.
    dayfirst Si True, les dates sont interprétées avec le jour avant le mois (utile pour les formats de date européens).
    utc Si True, convertit les dates en temps UTC.

    Exemple de code :

    import pandas as pd
    
    # Exemple de DataFrame avec des dates sous forme de chaînes
    df = pd.DataFrame({
        'date': ['2023-01-01', '2023-05-12', '2023-09-30']
    })
    
    # Conversion de la colonne 'date' en format datetime
    df['date'] = pd.to_datetime(df['date'])
    
    # Affichage du DataFrame après conversion
    print(df)

    Explication du code :

    1. DataFrame d'origine :
      Avant la conversion, les dates sont généralement sous forme de chaînes de caractères dans la colonne date.

    2. Conversion avec pd.to_datetime() :
      La fonction pd.to_datetime(df['date']) prend la colonne date en entrée et la convertit en format datetime, ce qui permet d'utiliser des fonctionnalités avancées liées aux dates dans Pandas, telles que les comparaisons temporelles ou les calculs sur les dates.

    3. Résultat :
      Après la conversion, la colonne date est transformée en objets datetime. Ces objets sont désormais prêts pour toute manipulation temporelle (par exemple, extraction d'année, mois, etc.).


    🔹 Remarques pratiques

    • Gestion de différents formats de dates :
      Si les dates sont dans un format particulier qui n'est pas automatiquement reconnu par Pandas, vous pouvez spécifier le format exact avec le paramètre format. Par exemple, si les dates sont dans le format jour-mois-année, vous pouvez indiquer ce format pour accélérer la conversion.

    • Gérer les erreurs :
      Si certaines valeurs de la colonne date ne sont pas des dates valides, vous pouvez choisir de les convertir en NaT (Not a Time) plutôt que de lever une exception, en utilisant le paramètre errors='coerce'.

    • Manipulation des dates :
      Une fois converties en datetime, vous pouvez facilement manipuler ces dates :

      • Extraire l'année, le mois, le jour.
      • Filtrer les dates dans une plage.
    • Conversion de chaînes contenant des dates et heures :
      Si les chaînes contiennent aussi des heures, pd.to_datetime() peut les gérer de manière transparente et convertir correctement la chaîne en format datetime complet.