Convertir une colonne en format datetime avec pd.to_datetime()

Fonctions :

  • pd.to_datetime()

    La fonction pd.to_datetime() est utilisée pour convertir une colonne contenant des dates sous forme de chaînes de caractères, d'entiers, ou d'autres types en objets datetime dans un DataFrame pandas. Cela permet de manipuler les dates plus facilement pour les analyses temporelles, telles que le calcul de la différence entre deux dates ou l'extraction de certaines composantes (année, mois, jour, etc.).

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    arg La donnée à convertir (cela peut être une liste, un tableau, ou une colonne d'un DataFrame).
    format (facultatif) Le format des dates sous forme de chaîne. Utilisé si vous connaissez à l'avance le format des dates (par exemple, 'YYYY-MM-DD'). Cela permet d'améliorer la performance de la conversion.
    errors (facultatif) Comment gérer les erreurs de conversion. Les options sont :
    • 'raise' (par défaut) : Lance une erreur si une conversion échoue.
    • 'coerce' : Remplace les erreurs par NaT (Not a Time).
    • 'ignore' : Ignore les erreurs et renvoie la donnée d'origine.
    dayfirst (facultatif) Si True, interprète les dates au format jour/mois/année plutôt qu'année/mois/jour.
    utc (facultatif) Si True, convertit la date en UTC.

    Exemple de code :

    import pandas as pd
    
    # Création d'un DataFrame avec une colonne de chaînes représentant des dates
    data = pd.DataFrame({
        'date_str': ['2023-03-15', '2022-11-30', '2024-07-21']
    })
    
    # Conversion de la colonne en datetime
    data['date'] = pd.to_datetime(data['date_str'])
    
    print(data)
    Résultat du code

    Explication du code :

    • Création d'un DataFrame : Un DataFrame pandas est créé avec une colonne appelée date_str contenant des chaînes de caractères représentant des dates comme '2023-03-15'.
    • Conversion en datetime : La fonction pd.to_datetime() est utilisée pour convertir les chaînes de caractères de la colonne date_str en objets datetime. Le résultat est stocké dans une nouvelle colonne nommée date.
    • Affichage du DataFrame : La commande print(data) affiche le DataFrame final, qui contient à la fois la colonne originale date_str et la nouvelle colonne date sous format datetime.