Convertir une colonne en format datetime avec pd.to_datetime()
Fonctions :
-
pd.to_datetime()
La fonction pd.to_datetime() est utilisée pour convertir une colonne contenant des dates sous forme de chaînes de caractères, d'entiers, ou d'autres types en objets datetime dans un DataFrame pandas. Cela permet de manipuler les dates plus facilement pour les analyses temporelles, telles que le calcul de la différence entre deux dates ou l'extraction de certaines composantes (année, mois, jour, etc.).
Importation :
import pandas as pd
Attributs :
Paramètre Description arg
La donnée à convertir (cela peut être une liste, un tableau, ou une colonne d'un DataFrame
).format
(facultatif) Le format des dates sous forme de chaîne. Utilisé si vous connaissez à l'avance le format des dates (par exemple, 'YYYY-MM-DD'
). Cela permet d'améliorer la performance de la conversion.errors
(facultatif) Comment gérer les erreurs de conversion. Les options sont : 'raise'
(par défaut) : Lance une erreur si une conversion échoue.'coerce'
: Remplace les erreurs parNaT
(Not a Time).'ignore'
: Ignore les erreurs et renvoie la donnée d'origine.
dayfirst
(facultatif) Si True
, interprète les dates au formatjour/mois/année
plutôt qu'année/mois/jour
.utc
(facultatif) Si True
, convertit la date en UTC.Exemple de code :
import pandas as pd # Création d'un DataFrame avec une colonne de chaînes représentant des dates data = pd.DataFrame({ 'date_str': ['2023-03-15', '2022-11-30', '2024-07-21'] }) # Conversion de la colonne en datetime data['date'] = pd.to_datetime(data['date_str']) print(data)
Explication du code :
- Création d'un DataFrame : Un
DataFrame
pandas est créé avec une colonne appeléedate_str
contenant des chaînes de caractères représentant des dates comme'2023-03-15'
. - Conversion en datetime : La fonction
pd.to_datetime()
est utilisée pour convertir les chaînes de caractères de la colonnedate_str
en objets datetime. Le résultat est stocké dans une nouvelle colonne nomméedate
. - Affichage du DataFrame : La commande
print(data)
affiche le DataFrame final, qui contient à la fois la colonne originaledate_str
et la nouvelle colonnedate
sous format datetime.