Saison
L’analyse des séries temporelles est un domaine fondamental de la data science, qui vise à comprendre, modéliser et prévoir des phénomènes évoluant au fil du temps. Qu’il s’agisse de ventes hebdomadaires, de températures quotidiennes ou de demandes énergétiques mensuelles, les données collectées dans le temps présentent souvent des motifs récurrents. L’un des plus fréquents et puissants de ces motifs est la saisonnalité.
Dans cet article, nous allons explorer la composante saisonnière d’une série temporelle, aussi appelée composante périodique, en détaillant sa définition, ses propriétés, ses implications analytiques, ainsi que les méthodes d’identification et de modélisation.
Définition d’une série temporelle
Une série temporelle est une suite de valeurs numériques observées à intervalles réguliers dans le temps :
Elle peut être analysée et modélisée en fonction de ses différentes composantes fondamentales : la tendance, la saisonnalité, les cycles (ou fluctuations économiques), et les résidus (ou bruits aléatoires).
Modélisation des composantes
Les séries temporelles peuvent être représentées de deux manières principales :
-
Modèle additif :
-
Modèle multiplicatif :
Où :
-
: tendance
-
: saisonnalité
-
: cycles longs
-
: résidus aléatoires
Nous allons nous concentrer ici sur , la composante saisonnière.
Qu’est-ce que la saisonnalité ?
La saisonnalité correspond à des fluctuations régulières qui se répètent à intervalles fixes dans une série temporelle.
Autrement dit, c’est un effet périodique prévisible : les variations saisonnières reviennent avec un période définie (jour, semaine, mois, année…).
Exemples courants :
-
Ventes de produits augmentant chaque décembre (effet Noël).
-
Trafic web chutant chaque week-end.
-
Températures plus élevées en été.
-
Hausse de la consommation électrique en hiver.
Caractéristiques de la saisonnalité
Périodicité
Elle est définie comme le nombre de périodes nécessaires pour qu’un motif complet se répète.
-
Période mensuelle : saisonnalité annuelle (p = 12)
-
Période journalière : saisonnalité hebdomadaire (p = 7)
-
Période horaire : saisonnalité quotidienne (p = 24)
Amplitude
C’est la hauteur des variations autour du niveau moyen. Une saisonnalité peut avoir :
-
Une amplitude constante (modèle additif)
-
Une amplitude proportionnelle au niveau de la série (modèle multiplicatif)
Stabilité
-
Saison régulière : les schémas ne changent pas dans le temps.
-
Saison variable : les motifs évoluent avec le temps (cas des événements mobiles comme le Ramadan ou Pâques).
Pourquoi analyser la saisonnalité ?
La prise en compte de la saisonnalité est essentielle dans :
-
Les prévisions : une mauvaise modélisation saisonnière conduit à des erreurs massives.
-
L’interprétation des tendances : ignorer la saisonnalité peut masquer ou fausser une tendance.
-
L’optimisation stratégique : stock, campagnes marketing, gestion des ressources.
-
La détection d’anomalies : les pics hors saison sont potentiellement significatifs.
Identification de la saisonnalité
Avant de modéliser une saisonnalité, il faut l’identifier à l’aide de techniques visuelles ou statistiques.
Visualisation
La méthode la plus simple consiste à visualiser la série à l’aide de :
-
Graphique de la série temporelle.
-
Graphique saisonnier : regroupe les observations par période (ex : mois).
-
Boxplots par mois ou jour pour détecter des motifs récurrents.
Corrélogramme (ACF)
Le corrélogramme (ou fonction d’autocorrélation) est un outil clé. Il permet de détecter une répétition en montrant des pics aux lags multiples de la période saisonnière.
Exemple : si les ventes suivent un motif annuel, un pic sera visible tous les 12 lags.
Tests statistiques
-
Test de Kruskal-Wallis : vérifier si les distributions mensuelles sont différentes.
-
Test de Canova-Hansen : détecter la saisonnalité stochastique.
-
Spectral analysis : pour détecter des fréquences dominantes.
Méthodes d’extraction de la saisonnalité
Décomposition classique
Dans un modèle additif :
On peut extraire la saisonnalité en :
-
Estimant la tendance (moyennes mobiles).
-
Soustrayant la tendance de la série originale.
-
Calculant la moyenne de chaque sous-période (ex : moyenne de chaque mois sur plusieurs années).
STL (Seasonal and Trend decomposition using Loess)
STL est une méthode robuste, très utilisée en data science, qui décompose une série temporelle en :
Avantages :
-
Manipule des séries avec saisonnalité changeante.
-
Gère des séries incomplètes.
-
Permet de spécifier la fenêtre saisonnière.
Modèles de lissage exponentiel : Holt-Winters
Le modèle de Holt-Winters ajoute une composante saisonnière à la tendance :
-
Version additive : pour saisonnalité constante.
-
Version multiplicative : pour saisonnalité proportionnelle.
Formules :
Modèles statistiques
-
SARIMA : extension saisonnière de l’ARIMA avec composantes (P, D, Q, s) pour la saisonnalité.
-
TBATS : modélise les séries avec multiples saisonnalités.
-
Prophet (par Meta/Facebook) : décompose les séries en tendance, saisonnalité, jours fériés.
Modélisation multiple : cas de multi-saisonnalité
Certaines séries possèdent plusieurs cycles saisonniers, par exemple :
-
Données horaires : saisonnalité quotidienne + hebdomadaire.
-
Transport : pics du matin, midi, soir + variation entre jours de semaine.
Solution : modèles TBATS, Prophet, ou decomposition récursive.
Désaisonnalisation
La désaisonnalisation consiste à retirer la composante saisonnière de la série pour analyser la tendance ou les anomalies.
Formules :
-
Modèle additif :
-
Modèle multiplicatif :
C’est une étape clé pour les prévisions basées sur la tendance seule.
Erreurs fréquentes
-
Confondre saisonnalité et cycles : les cycles ne sont pas forcément réguliers.
-
Modéliser une saisonnalité variable comme constante.
-
Supposer une période sans vérification.
-
Utiliser un modèle additif quand la saisonnalité est proportionnelle.
Saisonnalité vs effets calendaires
Attention à ne pas confondre saisonnalité avec effets de calendrier :
-
Effet de fin de mois (salaires, facturations)
-
Jours fériés mobiles
-
Effets hebdomadaires (week-end vs jours ouvrables)
Ces effets doivent parfois être modélisés séparément.
Conclusion
La saisonnalité est une composante clé dans l’analyse de séries temporelles. Elle représente les schémas périodiques réguliers qui peuvent grandement influencer l’évolution d’une variable dans le temps. La détecter, la comprendre et la modéliser correctement est crucial pour obtenir des prévisions fiables et des analyses pertinentes.
De la visualisation initiale aux méthodes statistiques avancées (STL, SARIMA, TBATS), les outils à notre disposition sont nombreux. La rigueur dans la sélection de la méthode adaptée à la structure de la série étudiée fera toute la différence dans l’exactitude des résultats.