Loading [MathJax]/extensions/tex2jax.js

Extraction de l’année, du mois, du jour à partir d’une date

L’extraction de l’année, du mois et du jour à partir d’une date permet de décomposer une variable temporelle en plusieurs caractéristiques plus simples, facilitant ainsi l’analyse ou l’entraînement de modèles. Par exemple, l’année peut être extraite pour identifier des tendances sur plusieurs années, le mois pour détecter des effets saisonniers, et le jour pour analyser des patterns sur un cycle quotidien. Cette extraction est couramment réalisée via des méthodes intégrées des bibliothèques comme Pandas.

Fonctions :

  • Extraction des éléments de date

    Cette technique permet d'extraire des informations spécifiques (année, mois, jour) depuis une colonne contenant des dates dans un DataFrame.

    Importation :

    import pandas as pd

    Exemple de code :

    import pandas as pd
    
    # Création d'un DataFrame avec une colonne date
    df = pd.DataFrame({
        'date': pd.to_datetime(['2024-03-06', '2023-12-25', '2022-07-15'])
    })
    
    # Extraction des composantes de la date
    df['année'] = df['date'].dt.year
    df['mois'] = df['date'].dt.month
    df['jour'] = df['date'].dt.day
    
    print(df)
    Résultat du code

    Explication du code :

    import pandas as pd importe la bibliothèque pandas, renommée ici en pd pour simplifier son utilisation dans le code.

    Création d'un DataFrame avec une colonne date

    Un DataFrame df est créé avec une colonne 'date' contenant une liste de chaînes de caractères représentant des dates. Ces chaînes sont converties en objets de type datetime avec la méthode pd.to_datetime(), ce qui permet de manipuler plus facilement les dates et d'extraire leurs différentes composantes.

    Extraction des composantes de la date

    Les méthodes dt.year, dt.month et dt.day sont utilisées pour extraire respectivement l'année, le mois et le jour de chaque date dans la colonne 'date'. Ces valeurs extraites sont assignées aux nouvelles colonnes 'année', 'mois' et 'jour' du DataFrame.

    Affichage du DataFrame

    La fonction print(df) affiche le DataFrame df, qui contient désormais les informations sur l'année, le mois et le jour extraites de la colonne 'date'.