Conversion en format datetime
La conversion en format datetime avec pd.to_datetime(df[‘date’]) permet de transformer une colonne de dates au format texte (chaîne de caractères) en un format de date et heure utilisable par Pandas. Cela permet de profiter des fonctionnalités et des méthodes de gestion de dates et d’heures (comme l’extraction d’années, mois, jours, etc.) pour effectuer des opérations chronologiques sur les données. Cette méthode gère automatiquement différents formats de dates et permet une manipulation plus précise des données temporelles.
Fonctions :
-
pd.to_datetime(df['date'])
La fonction pd.to_datetime() permet de convertir une colonne (ou une série) de dates sous forme de chaînes de caractères en un format de date et heure (datetime) utilisable dans un DataFrame Pandas. Cette conversion est essentielle pour effectuer des opérations de manipulation et d'analyse sur les données temporelles, comme le filtrage par date, la rééchantillonnage, ou la comparaison des dates.
Importation :
import pandas as pd
Attributs :
Paramètre Description arg
La série ou la colonne contenant les données à convertir. Cela peut être une liste, un tableau NumPy, ou une série Pandas avec des chaînes de caractères représentant des dates. format
Permet de spécifier le format des dates dans les chaînes (par exemple, '%Y-%m-%d'
pour2025-03-09
). Cela peut accélérer la conversion.errors
Spécifie comment gérer les erreurs. Par défaut ( 'raise'
), les erreurs lèveront une exception. Vous pouvez aussi spécifier'coerce'
pour transformer les erreurs enNaT
(Not a Time), ou'ignore'
pour laisser les erreurs inchangées.dayfirst
Si True
, les dates sont interprétées avec le jour avant le mois (utile pour les formats de date européens).utc
Si True
, convertit les dates en temps UTC.Exemple de code :
import pandas as pd # Exemple de DataFrame avec des dates sous forme de chaînes df = pd.DataFrame({ 'date': ['2023-01-01', '2023-05-12', '2023-09-30'] }) # Conversion de la colonne 'date' en format datetime df['date'] = pd.to_datetime(df['date']) # Affichage du DataFrame après conversion print(df)
Explication du code :
-
DataFrame d'origine :
Avant la conversion, les dates sont généralement sous forme de chaînes de caractères dans la colonnedate
. -
Conversion avec
pd.to_datetime()
:
La fonctionpd.to_datetime(df['date'])
prend la colonnedate
en entrée et la convertit en formatdatetime
, ce qui permet d'utiliser des fonctionnalités avancées liées aux dates dans Pandas, telles que les comparaisons temporelles ou les calculs sur les dates. -
Résultat :
Après la conversion, la colonnedate
est transformée en objetsdatetime
. Ces objets sont désormais prêts pour toute manipulation temporelle (par exemple, extraction d'année, mois, etc.).
🔹 Remarques pratiques
-
Gestion de différents formats de dates :
Si les dates sont dans un format particulier qui n'est pas automatiquement reconnu par Pandas, vous pouvez spécifier le format exact avec le paramètreformat
. Par exemple, si les dates sont dans le formatjour-mois-année
, vous pouvez indiquer ce format pour accélérer la conversion. -
Gérer les erreurs :
Si certaines valeurs de la colonnedate
ne sont pas des dates valides, vous pouvez choisir de les convertir enNaT
(Not a Time) plutôt que de lever une exception, en utilisant le paramètreerrors='coerce'
. -
Manipulation des dates :
Une fois converties endatetime
, vous pouvez facilement manipuler ces dates :- Extraire l'année, le mois, le jour.
- Filtrer les dates dans une plage.
-
Conversion de chaînes contenant des dates et heures :
Si les chaînes contiennent aussi des heures,pd.to_datetime()
peut les gérer de manière transparente et convertir correctement la chaîne en format datetime complet.
-