Time Series Forecasting (Prévision de Séries Temporelles)

Le time series forecasting (prévision de séries temporelles) est l’ensemble des techniques statistiques et de machine learning qui analysent des données ordonnées dans le temps pour prédire des valeurs futures, en exploitant les tendances, la saisonnalité et les corrélations présentes dans l’historique.

Catégorie: Data science / Analyse prédictive
Objectif: Prédire des valeurs futures à partir de données historiques ordonnées dans le temps
Méthodes classiques: ARIMA, Exponential Smoothing, Prophet, TBATS
Méthodes deep learning: LSTM, Transformer, PatchTST, N-BEATS
Foundation models: Chronos-2 (Amazon), TimesFM (Google), MOIRAI-2 (Salesforce), Lag-Llama, Time-LLM
Applications: Finance, retail, énergie, météo, supply chain, santé
Marché logiciel: ~1,8-2 milliards $ (time series analysis software, 2024)

Qu’est-ce qu’une série temporelle et pourquoi la prédire ?

Une série temporelle est une séquence de points de données enregistrés à intervalles réguliers dans le temps : le cours d’une action toutes les minutes, les ventes journalières d’un e-commerce, la température horaire d’un capteur industriel, le nombre de requêtes par seconde sur un serveur. Ce qui distingue ces données d’un dataset classique, c’est que l’ordre chronologique est porteur d’information. Mélangez les lignes d’un dataset tabulaire classique, vous ne perdez rien. Mélangez une série temporelle, vous détruisez sa structure fondamentale.

Prédire l’avenir à partir de ces séquences historiques est l’un des problèmes les plus anciens et les plus utiles de la data science. Les applications sont partout : un retailer qui anticipe la demande pour optimiser ses stocks, une banque qui modélise les flux de trésorerie, un énergéticien qui prévoit la consommation électrique pour équilibrer le réseau, un industriel qui estime la durée de vie résiduelle d’une machine. La qualité de la prévision conditionne directement la performance opérationnelle et financière de l’organisation.

La difficulté réside dans la nature même des données temporelles. Elles combinent plusieurs composantes qui se superposent : une tendance de fond (trend), des variations saisonnières (seasonality), des cycles plus longs et un bruit aléatoire. Ajoutez à cela les changements de régime (une pandémie, un changement réglementaire, une rupture de supply chain) et vous comprenez pourquoi un simple extrapolation linéaire ne suffit jamais.

Les quatre composantes d’une série temporelle

Avant de choisir un modèle, il faut comprendre ce que contient votre série. Toute série temporelle peut se décomposer en quatre composantes fondamentales :

Tendance (trend). La direction générale à long terme : croissante, décroissante ou stable. Exemples : la croissance du trafic web d’un site sur plusieurs années, l’augmentation progressive des températures mondiales. La tendance capture le mouvement de fond, indépendant des fluctuations court terme.

Saisonnalité (seasonality). Des patterns réguliers qui se répètent à intervalles fixes et connus : pic de ventes en décembre pour le retail, hausse de la consommation électrique en été et en hiver, augmentation du trafic web en semaine vs week-end. La période est fixe et prévisible.

Cycles. Des fluctuations sur des périodes plus longues et irrégulières, souvent liées à des facteurs économiques (cycles conjoncturels, cycles d’investissement). Contrairement à la saisonnalité, la durée des cycles n’est pas fixe.

Bruit (residual/noise). La composante aléatoire, ce qui reste après avoir extrait tendance, saisonnalité et cycles. Si votre modèle est bon, le résidu ressemble à du bruit blanc (pas de structure exploitable restante). Si vous y détectez encore des patterns, votre modèle rate quelque chose.

Décomposition comme outil de diagnostic La décomposition de séries temporelles (additive ou multiplicative) est souvent la première étape d’un projet de forecasting. Elle vous permet de visualiser chaque composante séparément et de choisir le type de modèle adapté. Python offre seasonal_decompose dans statsmodels et STL (Seasonal and Trend decomposition using Loess) pour une décomposition plus robuste.

Méthodes classiques (statistiques)

Les méthodes statistiques restent la base de tout praticien en forecasting. Elles sont interprétables, rapides à exécuter, et souvent suffisantes quand les données sont propres et le pattern est relativement stable.

ARIMA et ses variantes

ARIMA (AutoRegressive Integrated Moving Average) est le modèle de référence en prévision de séries temporelles. Il combine trois mécanismes : l’auto-régression (AR), qui prédit à partir des valeurs passées ; la différenciation (I, Integrated), qui rend la série stationnaire en soustrayant les observations précédentes ; et la moyenne mobile (MA), qui modélise la dépendance entre une observation et les erreurs passées.

Les trois paramètres (p, d, q) définissent le comportement du modèle : p = nombre de lags en auto-régression, d = degré de différenciation, q = taille de la fenêtre de moyenne mobile. En pratique, on utilise souvent auto_arima (librairie pmdarima en Python) pour trouver automatiquement les meilleurs paramètres.

Variantes importantes : SARIMA ajoute une composante saisonnière (paramètres P, D, Q, m), SARIMAX intègre des variables exogènes (météo, promotions, événements). Ces variantes sont largement utilisées par des institutions comme la Réserve fédérale américaine pour le forecasting économique.

Stationnarité : le prérequis d’ARIMA ARIMA exige une série stationnaire (moyenne et variance constantes dans le temps). Le test de Dickey-Fuller augmenté (ADF) permet de vérifier cette condition. Si la série n’est pas stationnaire, la différenciation (paramètre d) la transforme. C’est un concept fondamental : un modèle ARIMA appliqué à une série non stationnaire produira des prévisions aberrantes.

Exponential Smoothing (lissage exponentiel)

Le lissage exponentiel attribue des poids décroissants exponentiellement aux observations passées : les données récentes pèsent plus que les anciennes. Trois variantes coexistent :

Simple Exponential Smoothing (SES) pour les séries sans tendance ni saisonnalité. Holt’s Linear pour les séries avec tendance. Holt-Winters pour les séries avec tendance et saisonnalité (version additive ou multiplicative). Holt-Winters est particulièrement populaire dans le retail et la logistique pour le forecasting de demande à court et moyen terme.

Prophet

Développé par Meta (Facebook), Prophet est un modèle décompositionnel conçu pour être accessible aux non-spécialistes. Il gère nativement les données manquantes, les changements de tendance brusques et les effets de jours fériés. Sa force est la facilité de configuration : vous pouvez ajouter des holidays spécifiques à votre pays, définir des points de changement de tendance, et obtenir des intervalles de confiance par défaut.

Les limites : Prophet performe moins bien que les modèles plus spécialisés sur les séries à haute fréquence ou multivariate complexes. Il reste un excellent premier choix pour le prototypage rapide et les cas d’usage business standards (prévision de trafic web, de demande produit, de métriques SaaS).

TBATS

TBATS (Trigonometric, Box-Cox, ARMA, Trend, Seasonal) gère les saisonnalités complexes et multiples (par exemple, une série avec une saisonnalité journalière et hebdomadaire simultanément). C’est le choix privilégié pour les séries à haute fréquence avec des patterns saisonniers imbriqués.

Méthodes de machine learning

Les algorithmes de ML classiques peuvent être appliqués au forecasting de séries temporelles, à condition de transformer le problème en un problème de régression supervisée via le feature engineering temporel.

Feature engineering temporel

La clé est de créer des features pertinentes à partir des timestamps et des valeurs passées : lags (valeurs à t-1, t-7, t-30…), statistiques glissantes (moyenne mobile, écart-type sur fenêtre), encodage cyclique (jour de la semaine, mois, heure), indicateurs booléens (jour férié, week-end, événement promotionnel), et features de tendance.

Une fois ces features construites, vous pouvez utiliser XGBoost, Random Forest, LightGBM ou tout autre algorithme de régression. Ces modèles gèrent naturellement les relations non linéaires et les interactions entre variables, ce qui les rend souvent plus performants qu’ARIMA sur les séries multivariate complexes avec de nombreuses variables exogènes.

Attention au data leakage temporel La validation croisée classique (k-fold) est interdite en time series : elle viole l’ordre chronologique et crée du data leakage (le modèle « voit » le futur pendant l’entraînement). Utilisez le walk-forward validation (entraîner sur le passé, tester sur le futur, faire avancer la fenêtre). La classe TimeSeriesSplit de scikit-learn implémente ce principe. C’est l’erreur la plus fréquente des débutants en forecasting.

Méthodes de deep learning

Le deep learning a transformé le forecasting de séries temporelles en permettant de capturer des dépendances complexes et à long terme que les méthodes statistiques traditionnelles peinent à modéliser.

RNN et LSTM

Les réseaux de neurones récurrents (RNN) traitent les séquences en maintenant un état interne (mémoire) qui se met à jour à chaque pas de temps. Les LSTM (Long Short-Term Memory) résolvent le problème du vanishing gradient des RNN classiques grâce à des portes (gates) qui contrôlent le flux d’information : ce qu’on retient, ce qu’on oublie et ce qu’on produit en sortie.

Les LSTM restent très utilisés pour les séries temporelles financières, les signaux de capteurs et le forecasting de demande. Leur capacité à capturer les dépendances à long terme en fait un choix robuste, même si les architectures plus récentes (Transformers) les surpassent sur de nombreux benchmarks.

Transformers pour les séries temporelles

L’architecture Transformer, qui a révolutionné le NLP, s’est imposée dans le forecasting de séries temporelles avec des adaptations spécifiques. Le mécanisme d’attention permet de pondérer l’importance de chaque point temporel passé pour prédire le futur, sans la limitation séquentielle des RNN.

PatchTST (IBM, 2023) segmente la série en patches (segments) traités comme des tokens, de la même manière qu’un LLM traite les mots. Ce modèle a surpassé les autres Transformers sur des tâches de prévision météo, trafic et charge électrique avec des gains allant jusqu’à 60 % sur certains benchmarks. PatchTSMixer, également d’IBM, est une variante plus légère optimisée pour les séries multivariate.

Tiny Time Mixers (TTM), aussi d’IBM, pousse l’efficacité à l’extrême : avec moins d’un million de paramètres, ce modèle est jusqu’à 65 fois plus rapide à entraîner que les modèles de plusieurs milliards de paramètres tout en restant compétitif sur des tâches de few-shot forecasting. Il peut être entraîné en seulement 8 heures sur des données limitées.

N-BEATS et N-HiTS

N-BEATS (Neural Basis Expansion Analysis for Time Series) est un réseau purement feed-forward conçu spécifiquement pour le forecasting univarié. Il décompose la prévision en blocs spécialisés (tendance, saisonnalité) avec une interprétabilité supérieure aux boîtes noires classiques. N-HiTS est son successeur, optimisé pour les horizons de prédiction multiples grâce à un échantillonnage hiérarchique.

Foundation models : la révolution du zero-shot forecasting

Le changement le plus significatif dans le paysage du forecasting en 2025-2026 est l’émergence des foundation models dédiés aux séries temporelles. Le principe est le même que pour les LLM en NLP : un modèle pré-entraîné sur des volumes massifs de données temporelles peut générer des prévisions sur des séries jamais vues, sans ré-entraînement (zero-shot). Cela transforme le forecasting d’un problème d’entraînement de modèle en un problème de sélection de modèle.

Modèle	Éditeur	Architecture	Taille	Multivarié	Points forts
Chronos-2	Amazon	Transformer encoder + group attention	9M à 710M params (5 tailles)	Oui (natif)	SOTA zero-shot, 300+ prévisions/s par GPU, intégration SageMaker/AutoGluon
TimesFM 2.5	Google	Decoder-only	200M params	Partiel (XReg)	Intégré à BigQuery ML (SQL natif), fiable en production, Apache 2.0
MOIRAI-2	Salesforce	Decoder-only + quantile loss	Plusieurs tailles	Oui (natif)	Toute fréquence, tout nombre de variables, toute longueur de prédiction
Lag-Llama	ServiceNow	Decoder-only (inspiré LLaMA)	Compact	Non	Prévisions probabilistes avec intervalles d’incertitude, open source
Time-LLM	Recherche	Adaptateur sur LLM gelé	Dépend du LLM backbone	Non	Réutilise un LLM existant (GPT-2, LLaMA, BERT) sans le modifier
Tiny Time Mixers	IBM	Mixer (MLP-based)	<1M à 48M params	Oui	65x plus rapide, entraînable en 8h, surpasse des modèles à milliards de params
Toto	Datadog	Trajectory-based	Plusieurs tailles	Oui	Optimisé pour le monitoring infrastructure, prévisions de trajectoires multiples

Le benchmark GIFT-Eval (97 tâches, 55 datasets) et fev-bench sont devenus les références pour comparer ces modèles. En mars 2026, Chronos-2 domine le classement global avec une marge statistiquement significative sur TiRex et TimesFM en termes de win rate et de skill score. Mais le meilleur modèle dépend de votre cas d’usage : TimesFM 2.5 est imbattable si vous êtes déjà sur Google Cloud (forecasting SQL natif via BigQuery), MOIRAI-2 excelle sur les données multivariate complexes, et Lag-Llama est le choix pour les prévisions probabilistes avec quantification d’incertitude.

Commencez par le zero-shot Avant d’investir dans le fine-tuning ou le développement custom, évaluez les foundation models en zero-shot sur un échantillon représentatif de vos données. Vous serez souvent surpris par la qualité des résultats sans aucun entraînement spécifique. Le fine-tuning sur vos données propriétaires peut ensuite affiner la précision, mais il n’est pas toujours nécessaire.

Forecasting agentique : le contexte comme nouvelle donnée

L’une des avancées les plus récentes est l’émergence du forecasting agentique. Salesforce AI Research a dévoilé MoiraiAgent en janvier 2026, un framework qui intègre des informations contextuelles qualitatives (changements de politique, disruptions de supply chain, événements de marché) dans le processus de prédiction, en plus des données numériques historiques.

L’idée est que les modèles traditionnels échouent quand des facteurs externes créent des changements de régime que les données historiques ne peuvent pas anticiper. Un confinement, un changement de réglementation, une guerre commerciale : ces événements invalident les patterns passés. MoiraiAgent utilise un LLM comme coordinateur dynamique qui sélectionne les modèles experts les plus adaptés au contexte et intègre des données qualitatives dans la prédiction.

Sur le benchmark GIFT-CTX (conçu pour évaluer le forecasting contextuel), MoiraiAgent a nettement surpassé à la fois les foundation models spécialisés en séries temporelles et les LLM généralistes comme GPT-5.2 et Gemini 3.0 Pro. Cela valide l’hypothèse qu’un framework dédié et outillé surpasse les approches généralistes pour le forecasting contextuel.

Applications concrètes par domaine

Finance et trading

Le forecasting financier combine des modèles de séries temporelles avec l’analyse de sentiment, les indicateurs macroéconomiques et l’apprentissage par renforcement pour l’allocation de portefeuille. Les RNN capturent les dépendances séquentielles dans les données de prix, les Transformers gèrent les inputs multivariate (actifs corrélés, indicateurs macro), et les approches bayésiennes quantifient l’incertitude des prédictions, critique dans un contexte de volatilité.

En pratique, les organisations qui maîtrisent le forecasting piloté par les données parviennent à prédire leurs revenus avec une précision de l’ordre de 5 %, un avantage compétitif considérable pour la planification budgétaire et l’allocation de ressources.

Retail et demand forecasting

La prévision de la demande est l’application historique du time series forecasting dans le retail. L’enjeu : aligner les stocks sur la demande réelle pour éviter à la fois le surstockage (capital immobilisé, pertes sur produits périssables) et la rupture de stock (ventes perdues, clients frustrés).

Les modèles modernes combinent les données de ventes historiques avec des variables exogènes : météo, promotions, événements locaux, comportement de navigation web. Les foundation models simplifient considérablement cette tâche pour les retailers qui gèrent des milliers de SKU : un seul modèle pré-entraîné peut générer des prévisions pour l’ensemble du catalogue sans entraînement spécifique par produit.

Énergie

Les énergéticiens utilisent le forecasting pour prédire la consommation électrique (équilibrage du réseau), la production des sources renouvelables (solaire, éolien, fortement dépendants de la météo) et les prix de l’énergie sur les marchés spot. La haute fréquence des données (minute, voire seconde) et la multiplicité des variables (température, ensoleillement, vent, jour de la semaine, activité industrielle) en font un terrain idéal pour les modèles de deep learning et les foundation models.

Santé

Le forecasting de séries temporelles médicales couvre la prédiction de l’afflux de patients aux urgences, la propagation épidémique, la prévision de crises épileptiques à partir de données EEG (l’approche Future-Guided Learning publiée dans Nature Communications a démontré une augmentation de 44,8 % de l’AUC-ROC pour cette tâche), et le monitoring de signes vitaux via des wearables.

Industrie et IoT

La maintenance prédictive repose fondamentalement sur le forecasting de séries temporelles de capteurs : vibration, température, pression, courant. L’objectif est de prédire la durée de vie résiduelle (RUL) d’un composant à partir de l’évolution de ses paramètres opérationnels dans le temps.

Supply chain et logistique

La prévision des délais de livraison, des volumes de transport et des besoins en matières premières utilise des modèles temporels intégrant les données historiques, les commandes en cours, les conditions de transport et les événements géopolitiques. La supply chain optimization s’appuie fortement sur la qualité de ces prévisions.

Outils et librairies

Outil / Librairie	Langage	Type	Cas d’usage principal
statsmodels	Python	Statistique	ARIMA, SARIMAX, lissage exponentiel, tests de stationnarité
pmdarima	Python	Statistique	Auto-ARIMA (recherche automatique de paramètres)
Prophet	Python / R	Décompositionnel	Forecasting business accessible, gestion des holidays
Darts	Python	Framework unifié	Interface unifiée pour modèles classiques + DL + foundation models
NeuralForecast	Python	Deep learning	N-BEATS, N-HiTS, LSTM, Transformers avec API simple
GluonTS	Python	Deep learning	Modèles probabilistes, intégration Amazon/MXNet/PyTorch
Chronos / AutoGluon-TS	Python	Foundation model	Zero-shot forecasting via Chronos-2, intégration SageMaker
BigQuery ML	SQL	Cloud managed	AI.FORECAST avec TimesFM 2.5 directement en SQL
TimescaleDB / TigerData	SQL (PostgreSQL)	Base de données	Stockage et analyse de séries temporelles à haute performance

Pipeline type d’un projet de forecasting

Étape 1 : Exploration et décomposition

Visualisez vos données, identifiez les composantes (tendance, saisonnalité, bruit), testez la stationnarité (test ADF), détectez les anomalies et les données manquantes. La décomposition STL est votre meilleur ami à cette étape.

Étape 2 : Préparation des données

Gérez les données manquantes (interpolation, forward fill), traitez les outliers, et préparez le feature engineering si vous utilisez des modèles ML. Créez les splits temporels pour la validation : jamais de shuffle, toujours respecter l’ordre chronologique.

Étape 3 : Baseline et sélection de modèle

Commencez par des baselines naïves (dernière valeur connue, moyenne saisonnière) et un modèle statistique simple (ARIMA, Holt-Winters). Comparez ensuite avec des modèles ML et/ou des foundation models en zero-shot. Utilisez les métriques adaptées à votre contexte : MAE, RMSE, MAPE, MASE ou WQL (Weighted Quantile Loss) pour les prévisions probabilistes.

Étape 4 : Optimisation et validation

Ajustez les hyperparamètres via walk-forward validation. Si vous utilisez un foundation model, testez le fine-tuning sur vos données propriétaires. Évaluez la calibration des intervalles de confiance (un intervalle à 90 % devrait contenir 90 % des valeurs réelles).

Étape 5 : Déploiement et monitoring

Mettez en production avec un pipeline de ré-entraînement ou de mise à jour automatique. Surveillez le concept drift (les patterns changent dans le temps) et déclenchez un ré-entraînement quand la performance se dégrade. Les erreurs qui augmentent dans les folds tardifs de votre cross-validation sont souvent un signal de drift.

Métriques d’évaluation

Métrique	Formule simplifiée	Usage
MAE	Moyenne des \|erreurs\|	Interprétable, même unité que la série
RMSE	Racine(Moyenne des erreurs²)	Pénalise les grosses erreurs
MAPE	Moyenne des \|erreur/réel\| en %	Comparable entre séries, mais explose quand réel ≈ 0
MASE	MAE / MAE(naïf saisonnier)	Normalisée, standard en recherche, <1 = meilleur que le naïf
WQL	Weighted Quantile Loss	Évalue les prévisions probabilistes (quantiles)
CRPS	Continuous Ranked Probability Score	Standard pour les prévisions probabilistes sur les benchmarks

Conseil pratique : MASE est la métrique la plus robuste pour comparer des modèles sur des séries de différentes échelles. Elle mesure si votre modèle fait mieux qu’un simple naïf saisonnier. Si votre MASE est supérieur à 1, votre modèle sophistiqué fait pire que de simplement reprendre la valeur de la même période l’année précédente.

Pièges courants et bonnes pratiques

Data leakage temporel. C’est le piège numéro un. N’utilisez jamais de k-fold CV standard. Utilisez toujours le walk-forward validation ou TimeSeriesSplit. Les métriques gonflées par le leakage ne survivent jamais au passage en production.

Confondre corrélation et causalité. Deux séries qui bougent ensemble ne permettent pas toujours de prédire l’une à partir de l’autre. Le test de causalité de Granger peut aider à valider la direction de la relation prédictive.

Ignorer l’incertitude. Une prédiction ponctuelle (un seul chiffre) est rarement suffisante pour la prise de décision. Les prévisions probabilistes (intervalles de confiance, quantiles) permettent de planifier pour les scénarios optimistes et pessimistes.

Sur-ajuster sur le passé. Un modèle qui mémorise parfaitement les données historiques (erreur d’entraînement quasi nulle) mais échoue sur les données futures souffre d’overfitting. La régularisation, le early stopping et la validation temporelle sont vos garde-fous.

Négliger les changements de régime. Les modèles entraînés sur des données pré-pandémie prédisaient mal les patterns post-pandémie. Intégrez des indicateurs de rupture et mettez en place un monitoring de concept drift.

Sous-estimer les baselines. Un Auto-ARIMA bien paramétré ou même un simple moyenne saisonnière peut battre un réseau de neurones mal configuré. Commencez toujours par la baseline la plus simple avant de complexifier.

Univarié vs multivarié : quand passer au multivarié ?

Le forecasting univarié prédit les valeurs futures d’une seule variable à partir de son propre historique. Le forecasting multivarié intègre plusieurs variables corrélées pour enrichir la prédiction.

Exemple : prédire la consommation d’un bâtiment à partir de la température, l’humidité, l’heure du jour et l’historique de consommation (multivarié) sera plus précis que de se baser uniquement sur l’historique de consommation (univarié), car les facteurs externes expliquent une part significative de la variance.

Cependant, le multivarié n’est pas toujours meilleur. Si les variables supplémentaires ne sont pas corrélées avec la cible, elles ajoutent du bruit. Et les modèles multivariate sont plus complexes, plus lents et plus sujets à l’overfitting. Règle pragmatique : commencez en univarié, ajoutez des variables exogènes une par une, et vérifiez à chaque étape que la métrique de validation s’améliore.

Côté foundation models, les architectures diffèrent : Chronos-2 et MOIRAI-2 gèrent nativement le multivarié, TimesFM reste fondamentalement univarié (XReg en complément partiel), et Lag-Llama est strictement univarié.

Quand utiliser quoi ? Guide de décision

Situation	Méthode recommandée	Justification
Peu de données (<100 points)	ARIMA, Holt-Winters	Les modèles statistiques fonctionnent mieux avec peu de données
Données abondantes, une seule variable	Foundation model en zero-shot, puis N-BEATS si besoin	Zero-shot d’abord, fine-tune si insuffisant
Données multivariate complexes	MOIRAI-2, XGBoost avec features temporelles	Modélisation native des dépendances inter-séries
Prototype rapide, non-spécialiste	Prophet, puis foundation model	Accessibilité et rapidité de mise en œuvre
Production à grande échelle (milliers de séries)	Chronos-2 ou TimesFM	Un seul modèle pour tout, scalable
Prévisions probabilistes avec incertitude	Lag-Llama, MOIRAI-2, GluonTS	Distribution complète, pas juste un point
Stack Google Cloud	TimesFM 2.5 via BigQuery ML	SQL natif, zéro infrastructure ML à gérer
Contexte qualitatif important	MoiraiAgent, modèles hybrides	Intégration de données non numériques

Questions fréquentes sur le time series forecasting

Quelle est la différence entre time series forecasting et régression classique ?

La différence fondamentale est la dépendance temporelle. En régression classique, l’ordre des observations n’a pas d’importance. En time series forecasting, l’ordre est l’information principale : la valeur à t dépend des valeurs à t-1, t-2, etc. Cela impose des contraintes spécifiques : pas de shuffle lors du split train/test, validation par walk-forward, et des modèles conçus pour capturer les dépendances séquentielles. Vous pouvez utiliser un modèle de régression (XGBoost, etc.) pour du forecasting, mais il faut d’abord transformer la série en features temporelles et respecter strictement l’ordre chronologique lors de la validation.

Qu’est-ce qu’un foundation model pour les séries temporelles et en quoi ça change tout ?

Un foundation model en time series est un modèle de deep learning pré-entraîné sur des centaines de milliers de séries temporelles issues de domaines variés (finance, météo, énergie, trafic, etc.). Son atout majeur est le zero-shot forecasting : il peut prédire l’avenir d’une série qu’il n’a jamais vue sans ré-entraînement. Les principaux en 2026 sont Chronos-2 (Amazon), TimesFM 2.5 (Google) et MOIRAI-2 (Salesforce). Cela élimine des semaines de travail de feature engineering et de tuning de paramètres pour chaque nouveau dataset. En contrepartie, un fine-tuning sur vos données spécifiques peut parfois améliorer la précision par rapport au zero-shot.

ARIMA est-il encore utile face aux modèles de deep learning ?

Oui, absolument. ARIMA et ses variantes restent pertinents dans plusieurs situations : quand vous avez peu de données (moins de 100-200 points), quand l’interprétabilité est critique (finance réglementée, par exemple), quand vous avez besoin d’une baseline rapide et fiable, ou quand la série suit un pattern relativement simple. Sur les benchmarks récents, un Auto-ARIMA bien paramétré est souvent dans le top 10 parmi des dizaines de modèles bien plus complexes. La bonne pratique est de toujours commencer par ARIMA comme baseline avant de tester des modèles plus sophistiqués.

Comment gérer les changements de régime dans une série temporelle ?

Les changements de régime (pandémie, crise économique, changement réglementaire) sont le talon d’Achille de tous les modèles de forecasting, car ils violent l’hypothèse que les patterns passés se répéteront. Plusieurs approches existent : Prophet intègre nativement des points de changement de tendance, les modèles à états cachés (Hidden Markov Models) détectent les transitions entre régimes, et les approches agentiques comme MoiraiAgent intègrent du contexte qualitatif pour anticiper les ruptures. En pratique, le monitoring de concept drift (surveillance continue de la performance du modèle) est indispensable pour détecter rapidement quand un modèle n’est plus fiable et déclencher un ré-entraînement.

Quelle est la meilleure métrique pour évaluer un modèle de forecasting ?

Il n’y a pas de métrique universelle. Pour les prévisions ponctuelles, le MASE (Mean Absolute Scaled Error) est le plus robuste car il normalise par la performance d’un modèle naïf saisonnier et fonctionne quelle que soit l’échelle de la série. Pour les prévisions probabilistes (intervalles de confiance, quantiles), le CRPS (Continuous Ranked Probability Score) et le WQL (Weighted Quantile Loss) sont les standards de la recherche. L’essentiel est de choisir une métrique alignée avec votre coût métier : si les sous-prévisions coûtent plus cher que les sur-prévisions (rupture de stock vs surstockage), utilisez une fonction de perte asymétrique.