Évaluation des modèles

Une fois un modèle de série temporelle entraîné, il est essentiel d’évaluer sa performance pour déterminer sa qualité de prédiction et éviter le surapprentissage. L’évaluation repose généralement sur deux axes : la précision des prédictions et la complexité du modèle. Trois indicateurs couramment utilisés dans ce contexte sont : RMSE, AIC et BIC.


1. RMSE (Root Mean Squared Error)

Le RMSE mesure l’écart moyen quadratique entre les valeurs prédites et les valeurs réelles. Il met davantage l’accent sur les grandes erreurs.

Formule :

RMSE=1ni=1n(yiy^i)2\text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n}(y_i – \hat{y}_i)^2}

Où :

Interprétation :
Plus le RMSE est faible, plus le modèle est précis. Cependant, il dépend de l’échelle des données et ne permet pas de comparer des modèles sur des séries très différentes.


2. AIC (Akaike Information Criterion)

L’AIC évalue la qualité d’un modèle en tenant compte à la fois de son ajustement aux données et de sa complexité (nombre de paramètres).

Formule :

AIC=2k2ln(L^)\text{AIC} = 2k – 2 \ln(\hat{L})

Où :

Interprétation :
Plus l’AIC est faible, meilleur est le modèle (meilleur compromis entre performance et simplicité). Il permet de comparer plusieurs modèles entre eux sur les mêmes données.


3. BIC (Bayesian Information Criterion)

Le BIC est similaire à l’AIC, mais pénalise davantage les modèles complexes, surtout lorsque le nombre d’observations est grand.

Formule :

BIC=kln(n)2ln(L^)\text{BIC} = k \ln(n) – 2 \ln(\hat{L})

Où :

Interprétation :
Comme pour l’AIC, un BIC plus bas est préférable. Il est souvent utilisé dans le cadre de modèles ARIMA ou autres modèles paramétriques de séries temporelles.


4. Comparaison et usage

Critère Mesure quoi ? Sensibilité à la complexité Objectif
RMSE Précision des prédictions Aucune Minimiser l’erreur
AIC Ajustement + simplicité Moyenne Comparer des modèles
BIC Ajustement + complexité Forte Choisir modèle robuste

Conclusion :
Pour une évaluation complète, on combine souvent RMSE (précision) avec AIC/BIC (équilibre performance/complexité). Ces métriques permettent de choisir un modèle non seulement performant mais aussi généralisable.