Convertir une colonne en format datetime avec pd.to_datetime()

Fonctions :

  • pd.to_datetime()

    La fonction pd.to_datetime() est utilisée pour convertir une colonne contenant des dates sous forme de chaînes de caractères, d'entiers, ou d'autres types en objets datetime dans un DataFrame pandas. Cela permet de manipuler les dates plus facilement pour les analyses temporelles, telles que le calcul de la différence entre deux dates ou l'extraction de certaines composantes (année, mois, jour, etc.).

    Importation :

    import pandas as pd

    Attributs :

    Paramètre Description
    arg La donnée à convertir (cela peut être une liste, un tableau, ou une colonne d'un DataFrame).
    format (facultatif) Le format des dates sous forme de chaîne. Utilisé si vous connaissez à l'avance le format des dates (par exemple, 'YYYY-MM-DD'). Cela permet d'améliorer la performance de la conversion.
    errors (facultatif) Comment gérer les erreurs de conversion. Les options sont :
    • 'raise' (par défaut) : Lance une erreur si une conversion échoue.
    • 'coerce' : Remplace les erreurs par NaT (Not a Time).
    • 'ignore' : Ignore les erreurs et renvoie la donnée d'origine.
    dayfirst (facultatif) Si True, interprète les dates au format jour/mois/année plutôt qu'année/mois/jour.
    utc (facultatif) Si True, convertit la date en UTC.

    Exemple de code :

    import pandas as pd
    
    # Création d'un DataFrame avec une colonne de chaînes représentant des dates
    data = pd.DataFrame({
        'date_str': ['2023-03-15', '2022-11-30', '2024-07-21']
    })
    
    # Conversion de la colonne en datetime
    data['date'] = pd.to_datetime(data['date_str'])
    
    print(data)

    Explication du code :

    • Création d'un DataFrame : Un DataFrame pandas est créé avec une colonne 'date_str' contenant des dates sous forme de chaînes de caractères.
    • Conversion en datetime : La fonction pd.to_datetime() est utilisée pour convertir la colonne 'date_str' en une nouvelle colonne 'date' au format datetime. Cela permet de manipuler les dates comme des objets datetime et d'effectuer des opérations comme les comparaisons de dates, l'extraction de l'année, du mois, etc.
    • Affichage du résultat : La sortie sera un DataFrame où la colonne 'date' contient des objets datetime et non plus des chaînes.