Traffic Prediction (Prédiction du Trafic)
La traffic prediction (prédiction du trafic) est l’utilisation de modèles d’intelligence artificielle pour anticiper les conditions de circulation futures (débit de véhicules, vitesse, temps de parcours, congestion) à partir de données historiques et temps réel, afin d’optimiser la gestion des transports.
Quand Google Maps vous annonce 23 minutes de trajet alors que vous n’avez pas encore démarré, c’est de la traffic prediction. Quand une ville ajuste la durée de ses feux en temps réel pour fluidifier un carrefour, c’est de la traffic prediction. Ce domaine est l’un des cas d’usage les plus matures du deep learning appliqué aux données spatio-temporelles. Google Maps, qui s’appuie sur les Graph Neural Networks développés avec DeepMind, atteint une précision supérieure à 97 % sur les temps de parcours estimés (ETA). Les modèles récents intègrent des architectures Transformer, des réseaux de neurones sur graphes et même des LLM pour repousser les limites de cette précision.
- Définition
- Prédiction des flux de circulation futurs par IA à partir de données spatio-temporelles
- Données d’entrée
- Capteurs routiers, GPS (smartphones, véhicules), historique, météo, événements
- Modèles clés
- GNN (Graph Neural Networks), LSTM/GRU, Transformers spatio-temporels, STGCN, DCRNN
- Horizons
- Court terme (5-30 min), moyen terme (1-6 h), long terme (journée+)
- Applications
- Navigation (Google Maps, Waze), gestion de feux, planification urbaine, logistique
- Benchmark référence
- PeMS (Caltrans), METR-LA, PEMS-BAY
Le problème : pourquoi la prédiction du trafic est difficile
Le trafic routier est un système dynamique complexe où chaque route dépend de ses voisines. Un embouteillage sur un axe dévie le trafic vers les rues adjacentes, créant un effet de cascade. Prédire ce comportement est difficile pour plusieurs raisons fondamentales.
Dépendances spatio-temporelles. Le trafic sur un segment de route dépend à la fois de son historique (dimension temporelle : heures de pointe récurrentes, tendances saisonnières) et de l’état des segments voisins et lointains (dimension spatiale : propagation de la congestion). Modéliser ces deux dimensions simultanément est le défi central.
Non-stationnarité. Les patterns de trafic changent en permanence. Un nouveau chantier, un événement sportif, une pandémie, l’ouverture d’une nouvelle route modifient radicalement les flux. Les modèles doivent s’adapter continuellement.
Événements rares et imprévisibles. Accidents, inondations, manifestations, pannes de feux tricolores : ces événements perturbent brutalement les prédictions basées sur les patterns habituels. C’est le problème de la longue traîne, similaire à celui de la conduite autonome.
Résolution spatiale et temporelle. Prédire le trafic moyen sur une autoroute est relativement simple. Prédire la vitesse sur chaque segment de rue d’une ville entière, toutes les 5 minutes, est un problème d’une tout autre complexité. Les données de capteurs ne couvrent qu’un sous-ensemble des routes, et il faut inférer le trafic sur les segments non instrumentés.
Évolution des approches
Méthodes statistiques classiques
Les premières approches de prédiction du trafic (années 1970-2000) utilisaient des modèles statistiques de séries temporelles. Le modèle ARIMA (Autoregressive Integrated Moving Average) traite chaque segment de route comme une série temporelle indépendante. Il fonctionne correctement pour des flux stables et récurrents mais échoue sur les variations soudaines et ne capture pas les dépendances spatiales entre routes.
Les modèles de moyenne historique (Historical Average) sont encore plus simples : le trafic de mardi à 8h sera similaire à celui des mardis précédents à 8h. C’est une baseline étonnamment solide pour les patterns récurrents, mais totalement inadaptée aux événements inhabituels.
Machine learning classique
Les algorithmes de machine learning comme les SVM, Random Forest, XGBoost et LightGBM ont amélioré les prédictions en intégrant des features supplémentaires (météo, jour de la semaine, vacances, événements) au-delà des simples séries temporelles. Ces modèles restent compétitifs pour les prédictions à court terme sur des segments individuels, mais ne capturent pas nativement la structure du réseau routier.
Deep learning : la révolution
Le deep learning a transformé la traffic prediction en permettant de modéliser simultanément les dépendances temporelles (via RNN/LSTM/GRU) et spatiales (via CNN ou GNN) dans un cadre unifié. Les architectures ont évolué rapidement.
| Architecture | Principe | Forces | Exemples |
|---|---|---|---|
| LSTM / GRU | Réseaux récurrents pour séries temporelles | Capturent les dépendances temporelles longues | Prédiction par segment de route |
| CNN spatio-temporels | Convolutions 2D/3D sur des grilles de trafic | Capturent les patterns spatiaux locaux | Prédiction à l’échelle d’un quartier |
| STGCN | GCN (Graph Convolution Network) + RNN | Modélisent la topologie réelle du réseau routier | Benchmark de référence (2018) |
| DCRNN | Diffusion convolutionnelle + RNN sur graphe | Modélise la propagation directionnelle de la congestion | Google Maps (via DeepMind) |
| Graph WaveNet | GCN adaptatif + convolutions causales dilatées | Apprend automatiquement la matrice d’adjacence spatiale | État de l’art sur PeMS-BAY |
| Transformers spatio-temporels | Attention multi-tête sur dimensions spatiale et temporelle | Relations à longue portée, scalabilité | MVA-DCNet, ST-GRAT, ASTMGCNet |
| LLM pour le trafic | Large Language Models adaptés aux séries temporelles de trafic | Zero-shot, expliquabilité, raisonnement | GPT4TFP, STEP-LLM, LC-LLM (recherche) |
Les Graph Neural Networks : l’architecture dominante
Les Graph Neural Networks (GNN) sont l’architecture qui a le plus impacté la traffic prediction. La raison est intuitive : un réseau routier est naturellement un graphe, où les intersections sont des nœuds et les routes sont des arêtes. Les GNN exploitent cette structure pour propager l’information entre segments connectés.
STGCN (Spatio-Temporal Graph Convolutional Network)
Publié en 2018, STGCN combine des convolutions sur graphe (pour la dimension spatiale) avec des convolutions temporelles (pour la dimension temporelle). L’architecture est plus rapide et plus légère que les approches RNN traditionnelles car elle remplace les connexions récurrentes par des convolutions causales. STGCN a établi un nouveau standard de performance sur les benchmarks METR-LA et PeMS-BAY.
DCRNN (Diffusion Convolutional Recurrent Neural Network)
DCRNN modélise la propagation du trafic comme un processus de diffusion sur le graphe routier. La congestion se propage d’un segment à ses voisins de façon directionnelle (en aval, pas en amont). DCRNN capture ce phénomène via des convolutions de diffusion bidirectionnelles. C’est l’architecture qui a inspiré le système de prédiction de Google Maps, développé en partenariat avec DeepMind.
Le cas Google Maps / DeepMind
Google Maps utilise un système de prédiction en deux composantes. Premièrement, un « route analyser » qui traite des téraoctets de données de trafic pour construire des « Supersegments » (groupes de segments de route adjacents partageant un volume de trafic significatif). Deuxièmement, un modèle GNN qui prédit les temps de parcours sur ces Supersegments en tenant compte de la topologie du réseau routier.
Les données proviennent de plusieurs sources : signaux GPS de millions de smartphones Android, données historiques de trafic, capteurs routiers, rapports utilisateurs en temps réel (via Waze, acquis par Google en 2013), et informations sur les événements, la météo et les chantiers. Cette combinaison IA + données participatives humaines (human-in-the-loop) est ce qui rend Google Maps « incroyablement précis », selon les mots de l’équipe. La précision ETA dépasse 97 % pour la majorité des trajets, et le partenariat avec DeepMind a réduit les erreurs de plus de 50 % dans certaines villes comme Berlin, Jakarta, São Paulo, Sydney et Tokyo.
Avancées récentes des GNN pour le trafic
Les recherches de 2025-2026 poussent les GNN dans plusieurs directions. MVA-DCNet (Multi-View Attention Dilated Convolutional Network) analyse les dépendances temporelles sous trois angles complémentaires : la variance inter-échantillons, l’importance temporelle intra-séquence et l’horizon de prédiction. DTW-ST-GCN apprend une matrice d’adjacence spatio-temporelle dynamique qui capture le décalage de phase entre segments amont et aval, analogique aux modèles classiques d’ondes de choc de congestion.
Des modèles hybrides combinant GRU, LSTM et BiGRU avec des features extraites par EfficientNet et optimisées par des algorithmes d’optimisation métaheuristiques montrent des résultats prometteurs sur des données d’intersections urbaines, en classifiant le niveau de congestion via logique floue.
LLM et traffic prediction : la nouvelle frontière
L’arrivée des Large Language Models (Transformers à grande échelle) ouvre une nouvelle frontière pour la prédiction du trafic. Une revue publiée en 2026 dans Transportation Research Record recense déjà plus de 20 travaux combinant LLM et prédiction de mobilité.
GPT4TFP (GPT-4 for Traffic Flow Prediction) utilise un LLM pré-entraîné comme encodeur de séries temporelles spatio-temporelles de trafic. STEP-LLM enrichit les prompts avec des informations spatio-temporelles pour améliorer les prédictions. LC-LLM prédit les changements de voie avec des explications en langage naturel, ce qui est un avantage considérable pour l’explicabilité des décisions de conduite autonome.
L’avantage principal des LLM pour le trafic n’est pas nécessairement une précision supérieure aux GNN spécialisés, mais leur capacité de prédiction zero-shot (sans entraînement sur des données de trafic spécifiques), leur raisonnement explicable, et leur facilité d’intégration avec des sources de données textuelles (rapports d’incidents, prévisions météo, calendrier d’événements).
Sources de données et datasets
Sources de données en production
Capteurs routiers fixes. Boucles inductives, radars de comptage, caméras de surveillance. Le réseau PeMS (Performance Measurement System) de Caltrans en Californie collecte les données de plus de 39 000 capteurs et constitue la source de données la plus utilisée en recherche.
GPS et données mobiles. Les signaux GPS des smartphones et des véhicules connectés fournissent des données de vitesse et de trajectoire à grande échelle. Google exploite les données de milliards de trajets quotidiens via Android et Google Maps. Les flottes de VTC (Uber, Lyft, DiDi) et de livraison génèrent des données de qualité comparable.
Données participatives. Les rapports utilisateurs (accidents, chantiers, contrôles de police) via Waze, Google Maps ou des applications municipales ajoutent une couche d’information en temps réel que les capteurs seuls ne fournissent pas.
Données externes. Météo, calendrier (jours fériés, vacances scolaires, événements sportifs), travaux routiers, et données d’urbanisme sont essentiels pour les prédictions à moyen et long terme.
Datasets de recherche
| Dataset | Source | Contenu |
|---|---|---|
| PeMS-03/04/07/08 | Caltrans (Californie) | Débit, vitesse, occupation sur des milliers de capteurs routiers |
| METR-LA | Los Angeles | 207 capteurs, 4 mois de données de vitesse |
| PeMS-BAY | Baie de San Francisco | 325 capteurs, 6 mois de données de vitesse |
| TaxiBJ / BikeNYC | Pékin / New York | Flux de taxis et de vélos à l’échelle d’une ville |
Applications concrètes
Navigation et ETA
C’est l’application la plus visible : Google Maps, Waze, Apple Plans, TomTom utilisent la traffic prediction pour estimer les temps de parcours et recommander des itinéraires. La prédiction ne se limite pas au trafic actuel : le système anticipe comment les conditions vont évoluer pendant votre trajet (un trajet de 45 minutes traverse plusieurs « futures » conditions de trafic).
Contrôle adaptatif des feux
Les systèmes de transport intelligents (ITS) utilisent la prédiction du trafic pour ajuster dynamiquement la durée des phases de feux tricolores. Les prédictions à 1-2 minutes permettent d’allonger les phases vertes de façon proactive avant qu’une file d’attente ne se forme. Des chercheurs développent des systèmes basés sur l’apprentissage par renforcement (reinforcement learning) où l’agent IA contrôle les feux pour maximiser le débit global d’une intersection ou d’un réseau.
Planification urbaine
Les prédictions à long terme (tendances mensuelles, annuelles) informent les décisions d’infrastructure : où construire une nouvelle route, où élargir un axe, où installer un transport en commun. La modélisation spatio-temporelle à l’échelle de la ville entière (DHSTNet, ASTMGCNet) permet de simuler l’impact de scénarios d’aménagement sur les flux de trafic.
Logistique et livraison
Les entreprises de livraison (Amazon, UPS, FedEx, plateformes de livraison de repas) utilisent la traffic prediction pour optimiser les tournées, estimer les créneaux de livraison et réduire les coûts de carburant. La prédiction de la demande de VTC (Uber, Lyft, DiDi) est un cas d’usage connexe traité par les mêmes architectures GNN.
Sécurité routière et détection d’incidents
Les variations brusques dans les prédictions (une chute soudaine de vitesse non prédite par le modèle) peuvent servir de signal d’alerte précoce pour la détection d’incidents. Des modèles GNN ont été appliqués à la prédiction du risque d’accidents, en utilisant des données de trajectoire, de météo et de géographie pour identifier les segments à haut risque.
Défis et limites
Données manquantes. Les capteurs tombent en panne, les GPS perdent le signal, certaines routes ne sont pas instrumentées. L’imputation de données (estimer les valeurs manquantes) est une tâche en soi, souvent traitée par des GNN spécialisés.
Passage à l’échelle. Un réseau routier urbain peut contenir des centaines de milliers de segments. Entraîner un GNN sur un graphe de cette taille avec des données temporelles à haute fréquence pose des problèmes de mémoire et de temps de calcul. Les techniques de partitionnement de graphe et d’échantillonnage de voisinage sont indispensables.
Transfert entre villes. Un modèle entraîné sur le trafic de Los Angeles ne fonctionne pas directement à Paris. Les patterns de conduite, la topologie des routes, les habitudes de déplacement varient considérablement. Le transfer learning et l’apprentissage fédéré (federated learning) sont explorés pour résoudre ce problème.
Expliquabilité. Un GNN qui prédit un embouteillage dans 15 minutes ne peut pas toujours expliquer pourquoi. Pour les gestionnaires de trafic qui doivent prendre des décisions opérationnelles, l’explicabilité des prédictions est importante. Les approches LLM offrent une piste intéressante grâce à leur capacité de raisonnement en langage naturel.
Traffic prediction et villes intelligentes
La prédiction du trafic s’intègre dans l’écosystème plus large des smart cities. Les villes intelligentes combinent la traffic prediction avec d’autres systèmes IA : gestion de l’énergie (anticiper la consommation des bornes de recharge électrique en fonction du trafic), optimisation des transports en commun (ajuster les fréquences de bus en temps réel), et gestion des stationnements (prédire la disponibilité des places).
Séoul, par exemple, a lancé son programme « Autonomous Driving Vision 2030 » qui vise à déployer une infrastructure de données de trafic en temps réel couvrant l’ensemble de la ville d’ici 2026, incluant des signaux de feux connectés, des cartes de haute précision et une plateforme ouverte mise à jour en continu. En Chine, les villes de Pékin et Shanghai déploient des systèmes de « vehicle-road collaboration » (V2X) qui permettent aux véhicules autonomes de recevoir les prédictions de trafic directement depuis l’infrastructure routière.
Les jumeaux numériques de villes entières, alimentés par les données de capteurs et les modèles de prédiction, permettent de simuler l’impact de décisions urbanistiques (fermer une rue, créer une zone piétonne, modifier un plan de circulation) avant de les mettre en œuvre. C’est la convergence entre traffic prediction, simulation et aide à la décision.
Lien avec la conduite autonome
La traffic prediction et la conduite autonome sont deux domaines étroitement liés mais distincts. La conduite autonome prédit le comportement des agents individuels (ce piéton va-t-il traverser ?) à l’horizon de quelques secondes. La traffic prediction prédit le comportement agrégé du trafic (ce carrefour sera-t-il congestionné dans 15 minutes ?) à l’horizon de minutes à heures.
Les deux utilisent des architectures similaires (GNN, Transformers, LSTM) mais sur des données et des échelles différentes. La convergence se fait dans les systèmes de route optimization des robotaxis : Waymo et Baidu utilisent des modèles de traffic prediction pour optimiser le dispatching de leur flotte et les itinéraires de leurs véhicules autonomes en temps réel.
Verdict
La traffic prediction est l’un des cas d’usage IA les plus aboutis et les plus impactants au quotidien. Chaque fois que vous suivez un itinéraire Google Maps, vous bénéficiez de Graph Neural Networks entraînés sur des milliards de points de données. La précision est remarquable (97 %+ sur les ETA) pour les conditions normales.
Les GNN spatio-temporels restent l’approche dominante et la plus performante pour les prédictions à court terme sur des réseaux routiers. Les Transformers spatio-temporels gagnent du terrain pour les prédictions à plus long terme et les scénarios complexes. L’irruption des LLM apporte l’explicabilité et la capacité de raisonnement qui manquaient aux approches purement numériques.
Le vrai défi n’est plus la précision en conditions normales, mais la robustesse face à l’imprévu : événements rares, changements structurels du réseau, conditions météo extrêmes. C’est dans ces situations que les modèles actuels montrent leurs limites, et c’est là que les prochaines percées auront le plus d’impact.
Pour un développeur IA, la traffic prediction est un excellent point d’entrée dans les GNN et les données spatio-temporelles. Les datasets sont publics et bien documentés (PeMS, METR-LA), les architectures de référence sont open source (STGCN, DCRNN, Graph WaveNet), et les applications sont immédiates et mesurables. C’est aussi un domaine où les compétences sont très demandées par les GAFA, les opérateurs de mobilité et les smart cities.
Questions fréquentes sur la traffic prediction
Comment Google Maps prédit-il le trafic avant même qu’un embouteillage ne commence ?
Google Maps combine trois sources d’information. Les données GPS temps réel de millions de smartphones Android et d’utilisateurs Google Maps/Waze permettent de connaître les vitesses actuelles sur chaque route. Les données historiques (patterns récurrents par jour/heure) permettent d’anticiper les congestions habituelles. Un modèle de Graph Neural Networks, développé avec DeepMind, modélise la propagation de la congestion à travers le réseau routier : si un segment ralentit, le modèle prédit l’impact sur les segments adjacents dans les minutes suivantes. C’est cette combinaison qui permet de prédire un embouteillage avant qu’il ne vous atteigne.
Pourquoi les Graph Neural Networks sont-ils meilleurs que les LSTM pour le trafic ?
Les LSTM (Long Short-Term Memory) capturent les dépendances temporelles (le trafic de maintenant dépend du trafic il y a 5, 15, 30 minutes) mais traitent chaque route indépendamment. Ils ne « voient » pas que la congestion sur l’autoroute A se propage vers le boulevard B. Les Graph Neural Networks modélisent explicitement la topologie du réseau routier : chaque route est un nœud, chaque connexion est une arête. L’information circule entre les nœuds via les arêtes, imitant la propagation réelle du trafic. Les architectures combinant GNN (spatial) et LSTM ou Transformers (temporel), comme STGCN et DCRNN, surpassent systématiquement les approches purement temporelles sur tous les benchmarks.
Les LLM vont-ils remplacer les GNN pour la prédiction du trafic ?
Pas dans l’immédiat. Les GNN spatio-temporels restent plus précis que les LLM pour la prédiction numérique à court terme sur des réseaux routiers instrumentés. Les LLM apportent des avantages complémentaires : la prédiction zero-shot (sans données d’entraînement spécifiques), l’intégration de sources textuelles (rapports d’incidents, prévisions météo), et surtout l’explicabilité (le modèle peut « expliquer » pourquoi il prédit un embouteillage). La tendance est à l’hybridation : des GNN pour les prédictions numériques de base, des LLM pour le raisonnement contextuel et l’explication. Plus de 20 travaux de recherche combinent déjà les deux approches.
Quelles données faut-il pour entraîner un modèle de traffic prediction ?
Au minimum, il faut des séries temporelles de vitesse ou de débit de véhicules (données de capteurs routiers ou de GPS) associées à la topologie du réseau routier (quelles routes sont connectées entre elles). Les datasets PeMS (Californie), METR-LA et PeMS-BAY sont les références académiques. Pour de meilleures performances, ajoutez des données météorologiques, un calendrier (jours fériés, événements), et des rapports d’incidents. En production, Google Maps exploite les données GPS de milliards de trajets quotidiens, ce qui explique sa précision supérieure aux modèles académiques.
La traffic prediction peut-elle aider à réduire les embouteillages ?
Oui, de trois façons. Premièrement, la navigation prédictive (Google Maps, Waze) redistribue les véhicules sur des itinéraires alternatifs avant que la congestion ne devienne critique. Deuxièmement, le contrôle adaptatif des feux tricolores ajuste les phases en fonction des prédictions à court terme, optimisant le débit aux carrefours. Troisièmement, la planification urbaine utilise les prédictions à long terme pour dimensionner les infrastructures. L’impact est mesurable : des études montrent que les systèmes de feux adaptatifs basés sur l’IA réduisent les temps d’attente de 15 à 30 % par rapport aux feux à minuterie fixe. La navigation prédictive, en lissant la charge du réseau, peut réduire les temps de trajet collectifs de 5 à 15 %.