Time Series Forecasting (Prévision de Séries Temporelles)
Le time series forecasting (prévision de séries temporelles) est l’ensemble des techniques statistiques et de machine learning qui analysent des données ordonnées dans le temps pour prédire des valeurs futures, en exploitant les tendances, la saisonnalité et les corrélations présentes dans l’historique.
- Catégorie
- Data science / Analyse prédictive
- Objectif
- Prédire des valeurs futures à partir de données historiques ordonnées dans le temps
- Méthodes classiques
- ARIMA, Exponential Smoothing, Prophet, TBATS
- Méthodes deep learning
- LSTM, Transformer, PatchTST, N-BEATS
- Foundation models
- Chronos-2 (Amazon), TimesFM (Google), MOIRAI-2 (Salesforce), Lag-Llama, Time-LLM
- Applications
- Finance, retail, énergie, météo, supply chain, santé
- Marché logiciel
- ~1,8-2 milliards $ (time series analysis software, 2024)
Qu’est-ce qu’une série temporelle et pourquoi la prédire ?
Une série temporelle est une séquence de points de données enregistrés à intervalles réguliers dans le temps : le cours d’une action toutes les minutes, les ventes journalières d’un e-commerce, la température horaire d’un capteur industriel, le nombre de requêtes par seconde sur un serveur. Ce qui distingue ces données d’un dataset classique, c’est que l’ordre chronologique est porteur d’information. Mélangez les lignes d’un dataset tabulaire classique, vous ne perdez rien. Mélangez une série temporelle, vous détruisez sa structure fondamentale.
Prédire l’avenir à partir de ces séquences historiques est l’un des problèmes les plus anciens et les plus utiles de la data science. Les applications sont partout : un retailer qui anticipe la demande pour optimiser ses stocks, une banque qui modélise les flux de trésorerie, un énergéticien qui prévoit la consommation électrique pour équilibrer le réseau, un industriel qui estime la durée de vie résiduelle d’une machine. La qualité de la prévision conditionne directement la performance opérationnelle et financière de l’organisation.
La difficulté réside dans la nature même des données temporelles. Elles combinent plusieurs composantes qui se superposent : une tendance de fond (trend), des variations saisonnières (seasonality), des cycles plus longs et un bruit aléatoire. Ajoutez à cela les changements de régime (une pandémie, un changement réglementaire, une rupture de supply chain) et vous comprenez pourquoi un simple extrapolation linéaire ne suffit jamais.
Les quatre composantes d’une série temporelle
Avant de choisir un modèle, il faut comprendre ce que contient votre série. Toute série temporelle peut se décomposer en quatre composantes fondamentales :
Tendance (trend). La direction générale à long terme : croissante, décroissante ou stable. Exemples : la croissance du trafic web d’un site sur plusieurs années, l’augmentation progressive des températures mondiales. La tendance capture le mouvement de fond, indépendant des fluctuations court terme.
Saisonnalité (seasonality). Des patterns réguliers qui se répètent à intervalles fixes et connus : pic de ventes en décembre pour le retail, hausse de la consommation électrique en été et en hiver, augmentation du trafic web en semaine vs week-end. La période est fixe et prévisible.
Cycles. Des fluctuations sur des périodes plus longues et irrégulières, souvent liées à des facteurs économiques (cycles conjoncturels, cycles d’investissement). Contrairement à la saisonnalité, la durée des cycles n’est pas fixe.
Bruit (residual/noise). La composante aléatoire, ce qui reste après avoir extrait tendance, saisonnalité et cycles. Si votre modèle est bon, le résidu ressemble à du bruit blanc (pas de structure exploitable restante). Si vous y détectez encore des patterns, votre modèle rate quelque chose.
seasonal_decompose dans statsmodels et STL (Seasonal and Trend decomposition using Loess) pour une décomposition plus robuste.
Méthodes classiques (statistiques)
Les méthodes statistiques restent la base de tout praticien en forecasting. Elles sont interprétables, rapides à exécuter, et souvent suffisantes quand les données sont propres et le pattern est relativement stable.
ARIMA et ses variantes
ARIMA (AutoRegressive Integrated Moving Average) est le modèle de référence en prévision de séries temporelles. Il combine trois mécanismes : l’auto-régression (AR), qui prédit à partir des valeurs passées ; la différenciation (I, Integrated), qui rend la série stationnaire en soustrayant les observations précédentes ; et la moyenne mobile (MA), qui modélise la dépendance entre une observation et les erreurs passées.
Les trois paramètres (p, d, q) définissent le comportement du modèle : p = nombre de lags en auto-régression, d = degré de différenciation, q = taille de la fenêtre de moyenne mobile. En pratique, on utilise souvent auto_arima (librairie pmdarima en Python) pour trouver automatiquement les meilleurs paramètres.
Variantes importantes : SARIMA ajoute une composante saisonnière (paramètres P, D, Q, m), SARIMAX intègre des variables exogènes (météo, promotions, événements). Ces variantes sont largement utilisées par des institutions comme la Réserve fédérale américaine pour le forecasting économique.
Exponential Smoothing (lissage exponentiel)
Le lissage exponentiel attribue des poids décroissants exponentiellement aux observations passées : les données récentes pèsent plus que les anciennes. Trois variantes coexistent :
Simple Exponential Smoothing (SES) pour les séries sans tendance ni saisonnalité. Holt’s Linear pour les séries avec tendance. Holt-Winters pour les séries avec tendance et saisonnalité (version additive ou multiplicative). Holt-Winters est particulièrement populaire dans le retail et la logistique pour le forecasting de demande à court et moyen terme.
Prophet
Développé par Meta (Facebook), Prophet est un modèle décompositionnel conçu pour être accessible aux non-spécialistes. Il gère nativement les données manquantes, les changements de tendance brusques et les effets de jours fériés. Sa force est la facilité de configuration : vous pouvez ajouter des holidays spécifiques à votre pays, définir des points de changement de tendance, et obtenir des intervalles de confiance par défaut.
Les limites : Prophet performe moins bien que les modèles plus spécialisés sur les séries à haute fréquence ou multivariate complexes. Il reste un excellent premier choix pour le prototypage rapide et les cas d’usage business standards (prévision de trafic web, de demande produit, de métriques SaaS).
TBATS
TBATS (Trigonometric, Box-Cox, ARMA, Trend, Seasonal) gère les saisonnalités complexes et multiples (par exemple, une série avec une saisonnalité journalière et hebdomadaire simultanément). C’est le choix privilégié pour les séries à haute fréquence avec des patterns saisonniers imbriqués.
Méthodes de machine learning
Les algorithmes de ML classiques peuvent être appliqués au forecasting de séries temporelles, à condition de transformer le problème en un problème de régression supervisée via le feature engineering temporel.
Feature engineering temporel
La clé est de créer des features pertinentes à partir des timestamps et des valeurs passées : lags (valeurs à t-1, t-7, t-30…), statistiques glissantes (moyenne mobile, écart-type sur fenêtre), encodage cyclique (jour de la semaine, mois, heure), indicateurs booléens (jour férié, week-end, événement promotionnel), et features de tendance.
Une fois ces features construites, vous pouvez utiliser XGBoost, Random Forest, LightGBM ou tout autre algorithme de régression. Ces modèles gèrent naturellement les relations non linéaires et les interactions entre variables, ce qui les rend souvent plus performants qu’ARIMA sur les séries multivariate complexes avec de nombreuses variables exogènes.
TimeSeriesSplit de scikit-learn implémente ce principe. C’est l’erreur la plus fréquente des débutants en forecasting.
Méthodes de deep learning
Le deep learning a transformé le forecasting de séries temporelles en permettant de capturer des dépendances complexes et à long terme que les méthodes statistiques traditionnelles peinent à modéliser.
RNN et LSTM
Les réseaux de neurones récurrents (RNN) traitent les séquences en maintenant un état interne (mémoire) qui se met à jour à chaque pas de temps. Les LSTM (Long Short-Term Memory) résolvent le problème du vanishing gradient des RNN classiques grâce à des portes (gates) qui contrôlent le flux d’information : ce qu’on retient, ce qu’on oublie et ce qu’on produit en sortie.
Les LSTM restent très utilisés pour les séries temporelles financières, les signaux de capteurs et le forecasting de demande. Leur capacité à capturer les dépendances à long terme en fait un choix robuste, même si les architectures plus récentes (Transformers) les surpassent sur de nombreux benchmarks.
Transformers pour les séries temporelles
L’architecture Transformer, qui a révolutionné le NLP, s’est imposée dans le forecasting de séries temporelles avec des adaptations spécifiques. Le mécanisme d’attention permet de pondérer l’importance de chaque point temporel passé pour prédire le futur, sans la limitation séquentielle des RNN.
PatchTST (IBM, 2023) segmente la série en patches (segments) traités comme des tokens, de la même manière qu’un LLM traite les mots. Ce modèle a surpassé les autres Transformers sur des tâches de prévision météo, trafic et charge électrique avec des gains allant jusqu’à 60 % sur certains benchmarks. PatchTSMixer, également d’IBM, est une variante plus légère optimisée pour les séries multivariate.
Tiny Time Mixers (TTM), aussi d’IBM, pousse l’efficacité à l’extrême : avec moins d’un million de paramètres, ce modèle est jusqu’à 65 fois plus rapide à entraîner que les modèles de plusieurs milliards de paramètres tout en restant compétitif sur des tâches de few-shot forecasting. Il peut être entraîné en seulement 8 heures sur des données limitées.
N-BEATS et N-HiTS
N-BEATS (Neural Basis Expansion Analysis for Time Series) est un réseau purement feed-forward conçu spécifiquement pour le forecasting univarié. Il décompose la prévision en blocs spécialisés (tendance, saisonnalité) avec une interprétabilité supérieure aux boîtes noires classiques. N-HiTS est son successeur, optimisé pour les horizons de prédiction multiples grâce à un échantillonnage hiérarchique.
Foundation models : la révolution du zero-shot forecasting
Le changement le plus significatif dans le paysage du forecasting en 2025-2026 est l’émergence des foundation models dédiés aux séries temporelles. Le principe est le même que pour les LLM en NLP : un modèle pré-entraîné sur des volumes massifs de données temporelles peut générer des prévisions sur des séries jamais vues, sans ré-entraînement (zero-shot). Cela transforme le forecasting d’un problème d’entraînement de modèle en un problème de sélection de modèle.
| Modèle | Éditeur | Architecture | Taille | Multivarié | Points forts |
|---|---|---|---|---|---|
| Chronos-2 | Amazon | Transformer encoder + group attention | 9M à 710M params (5 tailles) | Oui (natif) | SOTA zero-shot, 300+ prévisions/s par GPU, intégration SageMaker/AutoGluon |
| TimesFM 2.5 | Decoder-only | 200M params | Partiel (XReg) | Intégré à BigQuery ML (SQL natif), fiable en production, Apache 2.0 | |
| MOIRAI-2 | Salesforce | Decoder-only + quantile loss | Plusieurs tailles | Oui (natif) | Toute fréquence, tout nombre de variables, toute longueur de prédiction |
| Lag-Llama | ServiceNow | Decoder-only (inspiré LLaMA) | Compact | Non | Prévisions probabilistes avec intervalles d’incertitude, open source |
| Time-LLM | Recherche | Adaptateur sur LLM gelé | Dépend du LLM backbone | Non | Réutilise un LLM existant (GPT-2, LLaMA, BERT) sans le modifier |
| Tiny Time Mixers | IBM | Mixer (MLP-based) | <1M à 48M params | Oui | 65x plus rapide, entraînable en 8h, surpasse des modèles à milliards de params |
| Toto | Datadog | Trajectory-based | Plusieurs tailles | Oui | Optimisé pour le monitoring infrastructure, prévisions de trajectoires multiples |
Le benchmark GIFT-Eval (97 tâches, 55 datasets) et fev-bench sont devenus les références pour comparer ces modèles. En mars 2026, Chronos-2 domine le classement global avec une marge statistiquement significative sur TiRex et TimesFM en termes de win rate et de skill score. Mais le meilleur modèle dépend de votre cas d’usage : TimesFM 2.5 est imbattable si vous êtes déjà sur Google Cloud (forecasting SQL natif via BigQuery), MOIRAI-2 excelle sur les données multivariate complexes, et Lag-Llama est le choix pour les prévisions probabilistes avec quantification d’incertitude.
Forecasting agentique : le contexte comme nouvelle donnée
L’une des avancées les plus récentes est l’émergence du forecasting agentique. Salesforce AI Research a dévoilé MoiraiAgent en janvier 2026, un framework qui intègre des informations contextuelles qualitatives (changements de politique, disruptions de supply chain, événements de marché) dans le processus de prédiction, en plus des données numériques historiques.
L’idée est que les modèles traditionnels échouent quand des facteurs externes créent des changements de régime que les données historiques ne peuvent pas anticiper. Un confinement, un changement de réglementation, une guerre commerciale : ces événements invalident les patterns passés. MoiraiAgent utilise un LLM comme coordinateur dynamique qui sélectionne les modèles experts les plus adaptés au contexte et intègre des données qualitatives dans la prédiction.
Sur le benchmark GIFT-CTX (conçu pour évaluer le forecasting contextuel), MoiraiAgent a nettement surpassé à la fois les foundation models spécialisés en séries temporelles et les LLM généralistes comme GPT-5.2 et Gemini 3.0 Pro. Cela valide l’hypothèse qu’un framework dédié et outillé surpasse les approches généralistes pour le forecasting contextuel.
Applications concrètes par domaine
Finance et trading
Le forecasting financier combine des modèles de séries temporelles avec l’analyse de sentiment, les indicateurs macroéconomiques et l’apprentissage par renforcement pour l’allocation de portefeuille. Les RNN capturent les dépendances séquentielles dans les données de prix, les Transformers gèrent les inputs multivariate (actifs corrélés, indicateurs macro), et les approches bayésiennes quantifient l’incertitude des prédictions, critique dans un contexte de volatilité.
En pratique, les organisations qui maîtrisent le forecasting piloté par les données parviennent à prédire leurs revenus avec une précision de l’ordre de 5 %, un avantage compétitif considérable pour la planification budgétaire et l’allocation de ressources.
Retail et demand forecasting
La prévision de la demande est l’application historique du time series forecasting dans le retail. L’enjeu : aligner les stocks sur la demande réelle pour éviter à la fois le surstockage (capital immobilisé, pertes sur produits périssables) et la rupture de stock (ventes perdues, clients frustrés).
Les modèles modernes combinent les données de ventes historiques avec des variables exogènes : météo, promotions, événements locaux, comportement de navigation web. Les foundation models simplifient considérablement cette tâche pour les retailers qui gèrent des milliers de SKU : un seul modèle pré-entraîné peut générer des prévisions pour l’ensemble du catalogue sans entraînement spécifique par produit.
Énergie
Les énergéticiens utilisent le forecasting pour prédire la consommation électrique (équilibrage du réseau), la production des sources renouvelables (solaire, éolien, fortement dépendants de la météo) et les prix de l’énergie sur les marchés spot. La haute fréquence des données (minute, voire seconde) et la multiplicité des variables (température, ensoleillement, vent, jour de la semaine, activité industrielle) en font un terrain idéal pour les modèles de deep learning et les foundation models.
Santé
Le forecasting de séries temporelles médicales couvre la prédiction de l’afflux de patients aux urgences, la propagation épidémique, la prévision de crises épileptiques à partir de données EEG (l’approche Future-Guided Learning publiée dans Nature Communications a démontré une augmentation de 44,8 % de l’AUC-ROC pour cette tâche), et le monitoring de signes vitaux via des wearables.
Industrie et IoT
La maintenance prédictive repose fondamentalement sur le forecasting de séries temporelles de capteurs : vibration, température, pression, courant. L’objectif est de prédire la durée de vie résiduelle (RUL) d’un composant à partir de l’évolution de ses paramètres opérationnels dans le temps.
Supply chain et logistique
La prévision des délais de livraison, des volumes de transport et des besoins en matières premières utilise des modèles temporels intégrant les données historiques, les commandes en cours, les conditions de transport et les événements géopolitiques. La supply chain optimization s’appuie fortement sur la qualité de ces prévisions.
Outils et librairies
| Outil / Librairie | Langage | Type | Cas d’usage principal |
|---|---|---|---|
| statsmodels | Python | Statistique | ARIMA, SARIMAX, lissage exponentiel, tests de stationnarité |
| pmdarima | Python | Statistique | Auto-ARIMA (recherche automatique de paramètres) |
| Prophet | Python / R | Décompositionnel | Forecasting business accessible, gestion des holidays |
| Darts | Python | Framework unifié | Interface unifiée pour modèles classiques + DL + foundation models |
| NeuralForecast | Python | Deep learning | N-BEATS, N-HiTS, LSTM, Transformers avec API simple |
| GluonTS | Python | Deep learning | Modèles probabilistes, intégration Amazon/MXNet/PyTorch |
| Chronos / AutoGluon-TS | Python | Foundation model | Zero-shot forecasting via Chronos-2, intégration SageMaker |
| BigQuery ML | SQL | Cloud managed | AI.FORECAST avec TimesFM 2.5 directement en SQL |
| TimescaleDB / TigerData | SQL (PostgreSQL) | Base de données | Stockage et analyse de séries temporelles à haute performance |
Pipeline type d’un projet de forecasting
Étape 1 : Exploration et décomposition
Visualisez vos données, identifiez les composantes (tendance, saisonnalité, bruit), testez la stationnarité (test ADF), détectez les anomalies et les données manquantes. La décomposition STL est votre meilleur ami à cette étape.
Étape 2 : Préparation des données
Gérez les données manquantes (interpolation, forward fill), traitez les outliers, et préparez le feature engineering si vous utilisez des modèles ML. Créez les splits temporels pour la validation : jamais de shuffle, toujours respecter l’ordre chronologique.
Étape 3 : Baseline et sélection de modèle
Commencez par des baselines naïves (dernière valeur connue, moyenne saisonnière) et un modèle statistique simple (ARIMA, Holt-Winters). Comparez ensuite avec des modèles ML et/ou des foundation models en zero-shot. Utilisez les métriques adaptées à votre contexte : MAE, RMSE, MAPE, MASE ou WQL (Weighted Quantile Loss) pour les prévisions probabilistes.
Étape 4 : Optimisation et validation
Ajustez les hyperparamètres via walk-forward validation. Si vous utilisez un foundation model, testez le fine-tuning sur vos données propriétaires. Évaluez la calibration des intervalles de confiance (un intervalle à 90 % devrait contenir 90 % des valeurs réelles).
Étape 5 : Déploiement et monitoring
Mettez en production avec un pipeline de ré-entraînement ou de mise à jour automatique. Surveillez le concept drift (les patterns changent dans le temps) et déclenchez un ré-entraînement quand la performance se dégrade. Les erreurs qui augmentent dans les folds tardifs de votre cross-validation sont souvent un signal de drift.
Métriques d’évaluation
| Métrique | Formule simplifiée | Usage |
|---|---|---|
| MAE | Moyenne des |erreurs| | Interprétable, même unité que la série |
| RMSE | Racine(Moyenne des erreurs²) | Pénalise les grosses erreurs |
| MAPE | Moyenne des |erreur/réel| en % | Comparable entre séries, mais explose quand réel ≈ 0 |
| MASE | MAE / MAE(naïf saisonnier) | Normalisée, standard en recherche, <1 = meilleur que le naïf |
| WQL | Weighted Quantile Loss | Évalue les prévisions probabilistes (quantiles) |
| CRPS | Continuous Ranked Probability Score | Standard pour les prévisions probabilistes sur les benchmarks |
Conseil pratique : MASE est la métrique la plus robuste pour comparer des modèles sur des séries de différentes échelles. Elle mesure si votre modèle fait mieux qu’un simple naïf saisonnier. Si votre MASE est supérieur à 1, votre modèle sophistiqué fait pire que de simplement reprendre la valeur de la même période l’année précédente.
Pièges courants et bonnes pratiques
Data leakage temporel. C’est le piège numéro un. N’utilisez jamais de k-fold CV standard. Utilisez toujours le walk-forward validation ou TimeSeriesSplit. Les métriques gonflées par le leakage ne survivent jamais au passage en production.
Confondre corrélation et causalité. Deux séries qui bougent ensemble ne permettent pas toujours de prédire l’une à partir de l’autre. Le test de causalité de Granger peut aider à valider la direction de la relation prédictive.
Ignorer l’incertitude. Une prédiction ponctuelle (un seul chiffre) est rarement suffisante pour la prise de décision. Les prévisions probabilistes (intervalles de confiance, quantiles) permettent de planifier pour les scénarios optimistes et pessimistes.
Sur-ajuster sur le passé. Un modèle qui mémorise parfaitement les données historiques (erreur d’entraînement quasi nulle) mais échoue sur les données futures souffre d’overfitting. La régularisation, le early stopping et la validation temporelle sont vos garde-fous.
Négliger les changements de régime. Les modèles entraînés sur des données pré-pandémie prédisaient mal les patterns post-pandémie. Intégrez des indicateurs de rupture et mettez en place un monitoring de concept drift.
Sous-estimer les baselines. Un Auto-ARIMA bien paramétré ou même un simple moyenne saisonnière peut battre un réseau de neurones mal configuré. Commencez toujours par la baseline la plus simple avant de complexifier.
Univarié vs multivarié : quand passer au multivarié ?
Le forecasting univarié prédit les valeurs futures d’une seule variable à partir de son propre historique. Le forecasting multivarié intègre plusieurs variables corrélées pour enrichir la prédiction.
Exemple : prédire la consommation d’un bâtiment à partir de la température, l’humidité, l’heure du jour et l’historique de consommation (multivarié) sera plus précis que de se baser uniquement sur l’historique de consommation (univarié), car les facteurs externes expliquent une part significative de la variance.
Cependant, le multivarié n’est pas toujours meilleur. Si les variables supplémentaires ne sont pas corrélées avec la cible, elles ajoutent du bruit. Et les modèles multivariate sont plus complexes, plus lents et plus sujets à l’overfitting. Règle pragmatique : commencez en univarié, ajoutez des variables exogènes une par une, et vérifiez à chaque étape que la métrique de validation s’améliore.
Côté foundation models, les architectures diffèrent : Chronos-2 et MOIRAI-2 gèrent nativement le multivarié, TimesFM reste fondamentalement univarié (XReg en complément partiel), et Lag-Llama est strictement univarié.
Quand utiliser quoi ? Guide de décision
| Situation | Méthode recommandée | Justification |
|---|---|---|
| Peu de données (<100 points) | ARIMA, Holt-Winters | Les modèles statistiques fonctionnent mieux avec peu de données |
| Données abondantes, une seule variable | Foundation model en zero-shot, puis N-BEATS si besoin | Zero-shot d’abord, fine-tune si insuffisant |
| Données multivariate complexes | MOIRAI-2, XGBoost avec features temporelles | Modélisation native des dépendances inter-séries |
| Prototype rapide, non-spécialiste | Prophet, puis foundation model | Accessibilité et rapidité de mise en œuvre |
| Production à grande échelle (milliers de séries) | Chronos-2 ou TimesFM | Un seul modèle pour tout, scalable |
| Prévisions probabilistes avec incertitude | Lag-Llama, MOIRAI-2, GluonTS | Distribution complète, pas juste un point |
| Stack Google Cloud | TimesFM 2.5 via BigQuery ML | SQL natif, zéro infrastructure ML à gérer |
| Contexte qualitatif important | MoiraiAgent, modèles hybrides | Intégration de données non numériques |
Questions fréquentes sur le time series forecasting
Quelle est la différence entre time series forecasting et régression classique ?
La différence fondamentale est la dépendance temporelle. En régression classique, l’ordre des observations n’a pas d’importance. En time series forecasting, l’ordre est l’information principale : la valeur à t dépend des valeurs à t-1, t-2, etc. Cela impose des contraintes spécifiques : pas de shuffle lors du split train/test, validation par walk-forward, et des modèles conçus pour capturer les dépendances séquentielles. Vous pouvez utiliser un modèle de régression (XGBoost, etc.) pour du forecasting, mais il faut d’abord transformer la série en features temporelles et respecter strictement l’ordre chronologique lors de la validation.
Qu’est-ce qu’un foundation model pour les séries temporelles et en quoi ça change tout ?
Un foundation model en time series est un modèle de deep learning pré-entraîné sur des centaines de milliers de séries temporelles issues de domaines variés (finance, météo, énergie, trafic, etc.). Son atout majeur est le zero-shot forecasting : il peut prédire l’avenir d’une série qu’il n’a jamais vue sans ré-entraînement. Les principaux en 2026 sont Chronos-2 (Amazon), TimesFM 2.5 (Google) et MOIRAI-2 (Salesforce). Cela élimine des semaines de travail de feature engineering et de tuning de paramètres pour chaque nouveau dataset. En contrepartie, un fine-tuning sur vos données spécifiques peut parfois améliorer la précision par rapport au zero-shot.
ARIMA est-il encore utile face aux modèles de deep learning ?
Oui, absolument. ARIMA et ses variantes restent pertinents dans plusieurs situations : quand vous avez peu de données (moins de 100-200 points), quand l’interprétabilité est critique (finance réglementée, par exemple), quand vous avez besoin d’une baseline rapide et fiable, ou quand la série suit un pattern relativement simple. Sur les benchmarks récents, un Auto-ARIMA bien paramétré est souvent dans le top 10 parmi des dizaines de modèles bien plus complexes. La bonne pratique est de toujours commencer par ARIMA comme baseline avant de tester des modèles plus sophistiqués.
Comment gérer les changements de régime dans une série temporelle ?
Les changements de régime (pandémie, crise économique, changement réglementaire) sont le talon d’Achille de tous les modèles de forecasting, car ils violent l’hypothèse que les patterns passés se répéteront. Plusieurs approches existent : Prophet intègre nativement des points de changement de tendance, les modèles à états cachés (Hidden Markov Models) détectent les transitions entre régimes, et les approches agentiques comme MoiraiAgent intègrent du contexte qualitatif pour anticiper les ruptures. En pratique, le monitoring de concept drift (surveillance continue de la performance du modèle) est indispensable pour détecter rapidement quand un modèle n’est plus fiable et déclencher un ré-entraînement.
Quelle est la meilleure métrique pour évaluer un modèle de forecasting ?
Il n’y a pas de métrique universelle. Pour les prévisions ponctuelles, le MASE (Mean Absolute Scaled Error) est le plus robuste car il normalise par la performance d’un modèle naïf saisonnier et fonctionne quelle que soit l’échelle de la série. Pour les prévisions probabilistes (intervalles de confiance, quantiles), le CRPS (Continuous Ranked Probability Score) et le WQL (Weighted Quantile Loss) sont les standards de la recherche. L’essentiel est de choisir une métrique alignée avec votre coût métier : si les sous-prévisions coûtent plus cher que les sur-prévisions (rupture de stock vs surstockage), utilisez une fonction de perte asymétrique.