- Titre : Estimating Network-Wide Hourly Traffic Flows from Probe Vehicle Speeds with Graph Neural Networks
- Présentateur : Léo Hein (INRIA)
- Résumé : La pollution de l'air, en partie issue d'activités anthropiques (industrie, transport, habitat, etc.), impacte grandement la santé humaine en augmentant notamment les risques de maladies respiratoires graves. Afin d'évaluer plus précisément cet impact, IFPEN développe des modèles d'estimation des émissions de polluants à l'échelle d'un réseau urbain complet, nécessitant des données de flux horaires pour chaque section de route. Dans l'optique de concevoir des outils applicables efficacement à tout territoire, cette thèse explore l'utilisation de modèles d'apprentissage profond, notamment les Graph Neural Networks (GNNs), pour estimer ces flux de trafic à partir d'informations topologiques, de vitesses horaires et d'un ensemble de descripteurs propres à chaque section de route. Un modèle hybride de Spatio-Temporal Graph Neural Network (HF-STGNN) est proposé afin d'apprendre les dépendances spatio-temporelles présentes dans les données. Les travaux actuels de la thèse se concentrent sur les capacités de généralisation du modèle à des sections de routes inconnues, en intégrant des contraintes physiques ainsi que de l'apprentissage auto-supervisé.
- Sujet de recherche associé : Action 213 - Apprentissage profond sur graphes pour la prédiction des flux de mobilité et de la qualité de l’air en milieu urbain
(*) Documents accesibles via l'authentification du portail MOBIDEC
Afficher le compte rendu
- Thèse portant sur un paradigme de prédiction de flux de mobilité par graph neural networks basé sur des données hétérogènes et contraint par des modèles physiques de flux de trafic
- Réalisée entre IFP Energies Nouvelles et l'université Gustave Eiffel sous la direction présentée par Aurélie
- Objectif principal : estimer les volumes de trafic à l'échelle des lignes et sections de route sur l'ensemble d'un réseau routier pour la planification urbaine et l'estimation de la qualité de l'air
- Forte corrélation observée entre hauts volumes de trafic et hautes concentrations de polluants (exemple de Lyon)
- Les modèles de machine learning/deep learning répondent aux limites des modèles physiques et de simulation : temps de calcul important et biais impliqués par la physique pré-implémentée
- Une fois la transformation apprise, l'inférence peut se faire de manière quasi immédiate à l'échelle du réseau routier complet avec flexibilité sur les données d'entrée
- Données disponibles : capteurs de flux (coûteux, faible couverture), données GPS (vitesse et trajectoire si couverture suffisante), et données géospatiales (caractéristiques des routes, topologie du graphe)
- Objectif : estimer les flux horaires sur une journée à partir des informations de vitesse, caractéristiques des sections de routes et topologie du graphe routier
- Estimation de l'état du trafic : consiste à inférer des informations de l'état du trafic à partir d'observations partielles
- Diagrammes fondamentaux macroscopiques : modélisent les relations entre volume, densité et vitesse, mais limites importantes notamment en régime fluide où de petites variations de vitesse peuvent correspondre à de grandes plages de flux
- Spatio-temporal graph neural networks : utilisent des techniques de message passing pour agréger itérativement les informations des voisins et comprendre les dépendances spatiales dans un graphe
- Exemple d'architecture STGNNs avec agrégations spatiales et temporelles successives
- Graph attention layers : calculent automatiquement des coefficients de poids pour associer une importance variable aux différents voisins
- Travaux antérieurs à l'IFPEN : modèle TrafficFlowNet par Giovanni Di Nunzio utilisant LSTM et informations de voisinage moyennées (sections en amont et aval), mais sans utiliser le voisinage topologique complet
- Graphe dual du réseau routier G avec ensemble V de sections de routes représentées comme nœuds
- Deux tenseurs d'entrée : descripteurs caractéristiques des routes F et informations de vitesse P
- Vérités terrain : informations de flux sur un sous-ensemble VL de nœuds labellisés (sections équipées de capteurs)
- Apprentissage par comparaison entre prédictions et labels (capteurs de flux), puis application de la transformation aux nœuds non labellisés
- Pour chaque nœud labellisé, considération d'un sous-graphe de voisinage d'ordre k avec toutes les informations associées (topologie, caractéristiques, vitesses) pour prédire la séquence de flux horaire (24 valeurs) sur le nœud cible uniquement
- Hybrid Factorized Spatio-Temporal Graph Neural Network pour traiter à la fois les données statiques (caractéristiques des routes) et spatio-temporelles (vitesses)
- Approche hybride à deux branches :
- Branche gauche : agrégations spatiales et temporelles successives sur les données de vitesse pour comprendre les dépendances spatio-temporelles
- Branche droite : agrégations spatiales uniquement sur les descripteurs statiques pour comprendre les dépendances spatiales
- Les informations des deux branches sont complémentaires (vitesse vs. longueur, nombre de voies, vitesse limite, etc.)
- Concaténation des embeddings des deux branches et étape finale de prédiction de la séquence de flux pour le nœud cible
- Dataset Lyon 2021 : 653 capteurs de flux mesurant les flux moyens horaires sur l'année complète
- HERE Maps : informations de speed patterns (vitesses moyennes horaires par jour de semaine) et descripteurs pour l'ensemble du réseau routier topologique
- Descripteurs statiques utilisés : longueur, classe fonctionnelle, nombre de voies, vitesse limite, vitesse de free-flow, courbure, pente
- 172 365 échantillons (653 nœuds labellisés × 365 jours) avec encodage temporel (heure, jour, mois)
- Graphe routier de Lyon : plus de 60 000 sections de route, couverture des capteurs de moins de 1% (sections en rouge), objectif d'inférer sur l'ensemble des sections en bleu
- Deux types d'évaluation : extrapolation temporelle (jours inconnus) et extrapolation spatiale (nœuds inconnus)
- Extrapolation temporelle : assez facile, peu de variabilité temporelle, modèles performent bien
- Extrapolation spatiale : beaucoup plus complexe, probablement dû au manque de quantité ou de variabilité des données
- L'utilisation des deux types d'informations (vitesse et caractéristiques) est importante, l'approche hybride est justifiée
- Ablation study montre une amélioration avec les informations de voisinage, mais moins importante que prévu, indiquant des limites à adresser
- Problème double :
- Seulement 653 sous-graphes de voisinage, très limité pour une approche deep learning
- Nécessité de généraliser à des distributions inconnues à l'inférence, les distributions d'entraînement peuvent diverger du reste du réseau (quasi 60 000 nœuds restants)
- Études de distribution montrent que les features statiques sont relativement bien représentées mais les vitesses sur les nœuds d'entraînement sont globalement plus élevées que sur le graphe complet
- Approche basée sur la physique (Physics-informed deep learning) : intégrer des connaissances physiques via contraintes ou régularisations pour rendre les représentations plus robustes et moins spécifiques aux données d'entraînement
- Constats : prédictions de volume parfois bien au-delà de la capacité de la route, relations flux-vitesse divergeant des diagrammes fondamentaux, comportement problématique en régime congestionné
- Implémentation d'estimation de capacité : estimer la capacité en parallèle à partir des embeddings des descripteurs statiques et borner les prédictions finales avec cette capacité estimée pour chaque section
- Résultats montrent de légères améliorations mais insuffisantes, indiquant un problème de représentation des données
- Utilisation des informations non labellisées du graphe : approche semi-supervisée actuelle utilise les voisinages locaux des 653 capteurs (ordre 2) mais beaucoup d'informations du graphe restent inutilisées
- Clustering sur les embeddings : dégager des archétypes de routes similaires en termes de descripteurs statiques et de capacités attendues, contraindre l'apprentissage de représentation via une loss annexe à la loss supervisée
-
Comprendre pourquoi les prédictions spatiales sont insuffisantes (manque de représentation des données) et augmenter la quantité et densité de la distribution de données d'entraînement
-
Implémenter des techniques pour gérer la généralisation hors distribution à l'inférence
-
Incorporer des informations des diagrammes fondamentaux en régime congestionné (très utile contrairement au régime fluide)
-
Améliorer l'architecture en mettant davantage en lien les deux branches pour des représentations plus complémentaires, explorer d'autres choix d'agrégation spatiale et temporelle
-
À plus long terme : intégrer des contraintes physiques globales (écoulement, cohérence entre débits sur routes voisines) au-delà des contraintes locales actuelles