Tendance
L’analyse de séries temporelles occupe une place centrale dans de nombreux domaines tels que la finance, l’économie, la météorologie, la production industrielle ou encore les sciences sociales. L’objectif fondamental de l’analyse de séries temporelles est de comprendre la dynamique des données collectées au fil du temps, de les modéliser, puis éventuellement de prédire les observations futures.
Les séries temporelles sont caractérisées par plusieurs composantes fondamentales : la tendance, la saisonnalité, les cycles, et les résidus (ou bruits). Dans cet article, nous allons explorer en profondeur la composante de tendance, souvent notée T(t), et analyser son rôle, ses propriétés, ses méthodes d’estimation, ainsi que son importance dans les modèles de séries temporelles.
Définition d’une série temporelle
Avant d’entrer dans les détails de la tendance, il convient de rappeler ce qu’est une série temporelle. Une série temporelle est une suite d’observations statistiques ordonnées chronologiquement. Chaque observation est associée à un moment donné, généralement espacé régulièrement (heures, jours, mois, années…).
Formellement, on peut représenter une série temporelle comme une fonction :
où représente la valeur observée au temps .
Composantes d’une série temporelle
Une série temporelle peut être modélisée de deux manières principales :
Modèle additif
Modèle multiplicatif
Où :
-
: Tendance (Trend)
-
: Saisonnalité
-
: Cycle économique
-
: Résidu ou bruit aléatoire
Le choix entre un modèle additif ou multiplicatif dépend de la nature des interactions entre les composantes.
Qu’est-ce que la tendance ?
La tendance (ou « trend » en anglais) est une composante fondamentale qui représente la direction générale de l’évolution d’une série temporelle sur le long terme. Elle traduit les variations de la moyenne de la série dans le temps.
En d’autres termes, la tendance capte l’évolution lente et soutenue d’une série temporelle, indépendamment des fluctuations saisonnières ou irrégulières.
Exemples concrets :
-
L’augmentation du PIB d’un pays sur plusieurs décennies.
-
La hausse moyenne du niveau de la mer à cause du changement climatique.
-
La croissance des utilisateurs actifs d’une plateforme numérique sur plusieurs années.
Caractéristiques de la tendance
Voici les caractéristiques principales de la tendance :
Direction
-
Croissante : la série augmente en moyenne au fil du temps.
-
Décroissante : la série diminue en moyenne.
-
Stable : il n’y a pas de changement significatif sur le long terme.
Linéarité
-
Tendance linéaire : évolution proportionnelle dans le temps.
Ex : -
Tendance non linéaire : évolution plus complexe, par exemple quadratique ou exponentielle.
Ex : ou
Long terme
La tendance s’intéresse à l’évolution sur une période longue. Elle ignore les variations rapides ou de courte durée comme les bruits ou la saisonnalité.
Pourquoi identifier la tendance ?
L’identification de la tendance permet de :
-
Comprendre les dynamiques globales : croissance économique, évolution des prix, etc.
-
Éliminer les biais temporels : pour une analyse correcte des autres composantes.
-
Prévoir le futur : les modèles prédictifs doivent généralement intégrer la tendance.
-
Détecter des anomalies : en comparant la série réelle à la tendance estimée.
Méthodes de détection et d’estimation de la tendance
Il existe plusieurs techniques pour identifier et estimer la tendance dans une série temporelle.
Moyenne mobile (Moving Average)
La méthode des moyennes mobiles consiste à lisser les données en remplaçant chaque valeur par la moyenne de ses voisins immédiats. Elle permet d’atténuer les effets des variations saisonnières et du bruit.
Formule :
où est la taille de la fenêtre.
Avantages :
-
Simple à implémenter.
-
Efficace pour lisser des séries avec fluctuations courtes.
Inconvénients :
-
Perte d’information aux extrémités.
-
Moins adapté aux tendances non linéaires.
Régression linéaire
La régression linéaire ajuste une droite aux données de la série temporelle.
Forme générale :
Où :
-
est l’ordonnée à l’origine.
-
est la pente, indiquant la direction et l’intensité de la tendance.
On peut estimer et via la méthode des moindres carrés.
Variantes :
-
Régression polynomiale (quadratique, cubique)
-
Régression logarithmique ou exponentielle (si les données évoluent de manière non linéaire)
Lissage exponentiel (Exponential Smoothing)
Le lissage exponentiel simple donne plus de poids aux observations récentes :
avec : le paramètre de lissage.
Plus est élevé, plus la série réagit aux nouvelles données.
Variantes :
-
Lissage exponentiel double (Holt) pour capturer les tendances linéaires.
-
Lissage exponentiel triple (Holt-Winters) pour gérer saisonnalité + tendance.
Méthodes non paramétriques : LOESS / LOWESS
Le lissage local (LOESS ou LOWESS) est une méthode non paramétrique qui ajuste une courbe locale (typiquement polynomiale) en fonction d’un sous-ensemble des données.
Avantages :
-
Très flexible pour les tendances non linéaires.
-
Résistant au bruit.
Visualisation de la tendance
Il est recommandé de visualiser la tendance à l’aide de :
-
Graphiques de la série originale et de la tendance superposée.
-
Décomposition graphique (additive ou multiplicative).
-
Résidus après extraction de la tendance.
Cela aide à mieux interpréter la série, notamment pour identifier des ruptures de tendance ou des événements exogènes.
Extraction de la tendance : méthodes avancées
STL (Seasonal-Trend decomposition using Loess)
STL est une méthode robuste et très utilisée pour la décomposition des séries temporelles.
Elle sépare une série en :
-
T_t : tendance
-
S_t : saisonnalité
-
R_t : bruit
Avantages :
-
Capable de gérer des tendances non linéaires.
-
Résistante aux valeurs aberrantes.
-
Flexibilité sur la taille de la saisonnalité.
Filtrage de Hodrick-Prescott (HP filter)
Utilisé notamment en macroéconomie, le filtre de Hodrick-Prescott sépare la tendance d’une série économique.
Il résout un problème d’optimisation où la tendance est lissée tout en gardant la série proche des données originales.
Erreurs à éviter
-
Confondre bruit et tendance : un pic temporaire n’est pas une tendance.
-
Sous- ou sur-lissage : trop lisser peut effacer la tendance, pas assez la rend peu lisible.
-
Mauvais choix de modèle : une tendance exponentielle modélisée par une droite peut induire en erreur.
Importance de la tendance dans les modèles de prévision
Les modèles de prévision tels que ARIMA, Prophet, ou les réseaux de neurones récurrents (RNN, LSTM) intègrent la tendance de manière explicite ou implicite.
-
ARIMA : différenciation pour éliminer la tendance.
-
Prophet (Facebook) : modélise la tendance avec des fonctions piecewise linéaires ou logistiques.
-
RNN/LSTM : apprennent la tendance à partir des données historiques.