Convertir une colonne en format datetime avec pd.to_datetime()
Fonctions :
-
pd.to_datetime()
La fonction pd.to_datetime() est utilisée pour convertir une colonne contenant des dates sous forme de chaînes de caractères, d'entiers, ou d'autres types en objets datetime dans un DataFrame pandas. Cela permet de manipuler les dates plus facilement pour les analyses temporelles, telles que le calcul de la différence entre deux dates ou l'extraction de certaines composantes (année, mois, jour, etc.).
Importation :
import pandas as pd
Attributs :
Paramètre Description arg
La donnée à convertir (cela peut être une liste, un tableau, ou une colonne d'un DataFrame
).format
(facultatif) Le format des dates sous forme de chaîne. Utilisé si vous connaissez à l'avance le format des dates (par exemple, 'YYYY-MM-DD'
). Cela permet d'améliorer la performance de la conversion.errors
(facultatif) Comment gérer les erreurs de conversion. Les options sont : 'raise'
(par défaut) : Lance une erreur si une conversion échoue.'coerce'
: Remplace les erreurs parNaT
(Not a Time).'ignore'
: Ignore les erreurs et renvoie la donnée d'origine.
dayfirst
(facultatif) Si True
, interprète les dates au formatjour/mois/année
plutôt qu'année/mois/jour
.utc
(facultatif) Si True
, convertit la date en UTC.Exemple de code :
import pandas as pd # Création d'un DataFrame avec une colonne de chaînes représentant des dates data = pd.DataFrame({ 'date_str': ['2023-03-15', '2022-11-30', '2024-07-21'] }) # Conversion de la colonne en datetime data['date'] = pd.to_datetime(data['date_str']) print(data)
Explication du code :
- Création d'un DataFrame : Un
DataFrame
pandas est créé avec une colonne'date_str'
contenant des dates sous forme de chaînes de caractères. - Conversion en
datetime
: La fonctionpd.to_datetime()
est utilisée pour convertir la colonne'date_str'
en une nouvelle colonne'date'
au formatdatetime
. Cela permet de manipuler les dates comme des objetsdatetime
et d'effectuer des opérations comme les comparaisons de dates, l'extraction de l'année, du mois, etc. - Affichage du résultat : La sortie sera un
DataFrame
où la colonne'date'
contient des objetsdatetime
et non plus des chaînes.