Extraction de l’année, du mois, du jour à partir d’une date
L’extraction de l’année, du mois et du jour à partir d’une date permet de décomposer une variable temporelle en plusieurs caractéristiques plus simples, facilitant ainsi l’analyse ou l’entraînement de modèles. Par exemple, l’année peut être extraite pour identifier des tendances sur plusieurs années, le mois pour détecter des effets saisonniers, et le jour pour analyser des patterns sur un cycle quotidien. Cette extraction est couramment réalisée via des méthodes intégrées des bibliothèques comme Pandas.
Fonctions :
-
Extraction des éléments de date
Cette technique permet d'extraire des informations spécifiques (année, mois, jour) depuis une colonne contenant des dates dans un DataFrame.
Importation :
import pandas as pd
Exemple de code :
import pandas as pd # Création d'un DataFrame avec une colonne date df = pd.DataFrame({ 'date': pd.to_datetime(['2024-03-06', '2023-12-25', '2022-07-15']) }) # Extraction des composantes de la date df['année'] = df['date'].dt.year df['mois'] = df['date'].dt.month df['jour'] = df['date'].dt.day print(df)
Explication du code :
import pandas as pd
importe la bibliothèque pandas, renommée ici enpd
pour simplifier son utilisation dans le code.Création d'un DataFrame avec une colonne date
Un DataFrame
df
est créé avec une colonne'date'
contenant une liste de chaînes de caractères représentant des dates. Ces chaînes sont converties en objets de type datetime avec la méthodepd.to_datetime()
, ce qui permet de manipuler plus facilement les dates et d'extraire leurs différentes composantes.Extraction des composantes de la date
Les méthodes
dt.year
,dt.month
etdt.day
sont utilisées pour extraire respectivement l'année, le mois et le jour de chaque date dans la colonne'date'
. Ces valeurs extraites sont assignées aux nouvelles colonnes'année'
,'mois'
et'jour'
du DataFrame.Affichage du DataFrame
La fonction
print(df)
affiche le DataFramedf
, qui contient désormais les informations sur l'année, le mois et le jour extraites de la colonne'date'
.