Saison

L’analyse des séries temporelles est un domaine fondamental de la data science, qui vise à comprendre, modéliser et prévoir des phénomènes évoluant au fil du temps. Qu’il s’agisse de ventes hebdomadaires, de températures quotidiennes ou de demandes énergétiques mensuelles, les données collectées dans le temps présentent souvent des motifs récurrents. L’un des plus fréquents et puissants de ces motifs est la saisonnalité.

Dans cet article, nous allons explorer la composante saisonnière d’une série temporelle, aussi appelée composante périodique, en détaillant sa définition, ses propriétés, ses implications analytiques, ainsi que les méthodes d’identification et de modélisation.


Définition d’une série temporelle

Une série temporelle est une suite de valeurs numériques observées à intervalles réguliers dans le temps :

Ytavect=1,2,...,nY_t \quad \text{avec} \quad t = 1, 2, …, n

Elle peut être analysée et modélisée en fonction de ses différentes composantes fondamentales : la tendance, la saisonnalité, les cycles (ou fluctuations économiques), et les résidus (ou bruits aléatoires).


Modélisation des composantes

Les séries temporelles peuvent être représentées de deux manières principales :

Yt=Tt+St+Ct+RtY_t = T_t + S_t + C_t + R_t

Yt=Tt×St×Ct×RtY_t = T_t \times S_t \times C_t \times R_t

Où :

Nous allons nous concentrer ici sur StS_t, la composante saisonnière.


Qu’est-ce que la saisonnalité ?

La saisonnalité correspond à des fluctuations régulières qui se répètent à intervalles fixes dans une série temporelle.

Autrement dit, c’est un effet périodique prévisible : les variations saisonnières reviennent avec un période définie (jour, semaine, mois, année…).

Exemples courants :


Caractéristiques de la saisonnalité

Périodicité

Elle est définie comme le nombre de périodes nécessaires pour qu’un motif complet se répète.

Amplitude

C’est la hauteur des variations autour du niveau moyen. Une saisonnalité peut avoir :

Stabilité


Pourquoi analyser la saisonnalité ?

La prise en compte de la saisonnalité est essentielle dans :


Identification de la saisonnalité

Avant de modéliser une saisonnalité, il faut l’identifier à l’aide de techniques visuelles ou statistiques.

Visualisation

La méthode la plus simple consiste à visualiser la série à l’aide de :

Corrélogramme (ACF)

Le corrélogramme (ou fonction d’autocorrélation) est un outil clé. Il permet de détecter une répétition en montrant des pics aux lags multiples de la période saisonnière.

Exemple : si les ventes suivent un motif annuel, un pic sera visible tous les 12 lags.

Tests statistiques


Méthodes d’extraction de la saisonnalité

Décomposition classique

Dans un modèle additif :

Yt=Tt+St+RtY_t = T_t + S_t + R_t

On peut extraire la saisonnalité en :

  1. Estimant la tendance (moyennes mobiles).

  2. Soustrayant la tendance de la série originale.

  3. Calculant la moyenne de chaque sous-période (ex : moyenne de chaque mois sur plusieurs années).

STL (Seasonal and Trend decomposition using Loess)

STL est une méthode robuste, très utilisée en data science, qui décompose une série temporelle en :

Yt=Tt+St+RtY_t = T_t + S_t + R_t

Avantages :

Modèles de lissage exponentiel : Holt-Winters

Le modèle de Holt-Winters ajoute une composante saisonnière à la tendance :

Formules :

Lt=αYtStp+(1α)(Lt1+Tt1)Tt=β(LtLt1)+(1β)Tt1St=γYtLt+(1γ)StpY^t+m=(Lt+mTt)Stp+m\begin{aligned} L_t &= \alpha \frac{Y_t}{S_{t-p}} + (1 – \alpha)(L_{t-1} + T_{t-1}) \\ T_t &= \beta (L_t – L_{t-1}) + (1 – \beta)T_{t-1} \\ S_t &= \gamma \frac{Y_t}{L_t} + (1 – \gamma)S_{t-p} \\ \hat{Y}_{t+m} &= (L_t + mT_t) S_{t-p+m} \end{aligned}

Modèles statistiques


Modélisation multiple : cas de multi-saisonnalité

Certaines séries possèdent plusieurs cycles saisonniers, par exemple :

Solution : modèles TBATS, Prophet, ou decomposition récursive.


Désaisonnalisation

La désaisonnalisation consiste à retirer la composante saisonnière de la série pour analyser la tendance ou les anomalies.

Formules :

Ytdeˊsaisonnaliseˊ=YtStY^{\text{désaisonnalisé}}_t = Y_t – S_t

Ytdeˊsaisonnaliseˊ=YtStY^{\text{désaisonnalisé}}_t = \frac{Y_t}{S_t}

C’est une étape clé pour les prévisions basées sur la tendance seule.


Erreurs fréquentes


Saisonnalité vs effets calendaires

Attention à ne pas confondre saisonnalité avec effets de calendrier :

Ces effets doivent parfois être modélisés séparément.


Conclusion

La saisonnalité est une composante clé dans l’analyse de séries temporelles. Elle représente les schémas périodiques réguliers qui peuvent grandement influencer l’évolution d’une variable dans le temps. La détecter, la comprendre et la modéliser correctement est crucial pour obtenir des prévisions fiables et des analyses pertinentes.

De la visualisation initiale aux méthodes statistiques avancées (STL, SARIMA, TBATS), les outils à notre disposition sont nombreux. La rigueur dans la sélection de la méthode adaptée à la structure de la série étudiée fera toute la différence dans l’exactitude des résultats.