- Titre : De l’inventaire des données aux usages : les travaux du Cerema
- Présentateur : Nassima FERNANE (CEREMA), Thibaut JONVILLE (CEREMA) et Xavier DURANG (CEREMA)
- Résumé : Présentation des travaux menés par le Cerema sur les données de mobilité. Ces travaux couvrent l’inventaire des données existantes, l’analyse des besoins et des cas d’usage, ainsi que l’étude des enjeux de structuration, de gouvernance et de partage des données. Ils intègrent également un travail d’analyse des pratiques à l’étranger, portant sur les plateformes de partage de données et les modèles de gouvernance associés, afin d’identifier des approches structurantes et des facteurs de réussite transférables au contexte français. Cette présentation permettra par ailleurs de mettre en lumière les travaux intégrés dans les livrables D1.1, D3.1a et D4.2, afin d’en partager les principaux contenus et enseignements. L’ensemble s’inscrit dans une démarche visant à mieux caractériser l’écosystème des données de mobilité, à en identifier les limites et à proposer des éléments de structuration favorisant leur mise en cohérence, leur interopérabilité et leur valorisation au service des politiques publiques et des acteurs du territoire.
- Sujet de recherche associé :
(*) Documents accesibles via l'authentification du portail MOBIDEC
Afficher le compte rendu
- CEREMA a présenté les travaux réalisés dans le cadre de Mob Sci-dat Factory sur les deux dernières années
- Trois livrables principaux ont été produits :
- D1.1 (action 114) : Inventaire des données
- D3.1a : Inventaire des pratiques à l'étranger
- D4.2 : Cas d'usage
- Les livrables sont disponibles sur MyBox INRIA avec des liens vers un article sur CEREMA web et un document de synthèse sur CEREMA doc
- Le projet s'inscrit dans le programme France 2030 avec un objectif d'impact sur la transition écologique
- Le projet a débuté par une analyse de l'utilisation actuelle des données, des usages et des blocages
- Méthodologie de collecte en deux phases :
- Environ 30 entretiens avec des experts (CEREMA, DRIEAT, Métropole de Lyon, etc.)
- Questionnaire en ligne pour toucher un public plus large (50-60 réponses)
- Questions posées : activités, méthodes, données utilisées, besoins manquants
- Plus de réponses du secteur public que du secteur privé
- Trois besoins principaux ont émergé :
- Accès à la donnée (notamment données téléphoies coûteuses)
- Utilisation de la donnée (outils et traitements insuffisants)
- Connaissance de l'existant (savoir quelles données existent)
- Plus de 80% des répondants rencontrent des difficultés d'accès à la donnée
- La majorité des données utilisées sont des données externes, avec le secteur public utilisant davantage de données internes
- Quatre thématiques de classification:
- Données de l'offre et de la demande
- Données d'usages
- Données socio-économiques
- Données environnementales
- Structure matricielle avec métadonnées complètes : fréquence de mise à jour, producteur, modalités d'accès et d'utilisation
- Approche par métier pour faciliter l'accessibilité aux non-experts
- Les données forment une chaîne : utilisation → production → alimentation de l'entrepôt de données territoriales
- Répertoire d'un certain nombre de cas d'usage avec des priorités différentes
- Analyse structurée du besoin partant de la demande des élus
- Chaîne de commandement : élu → service mobilité → modélisateurs/évaluateurs → sources de données
- Les besoins varient selon le profil de l'acteur (décideur, modificateur, opérateur) avec des niveaux de technicité différents
- Exemple concret : une question simple comme l'évolution des parts modales mobilise différentes données, services et compétences techniques
- Les contraintes légales influencent fortement les politiques locales et définissent les besoins
- Exemple des SERM (Services Express Régionaux Métropolitains) et du Grand Paris Express
- Objectifs législatifs clairs : amélioration de la qualité des transports, réduction de l'autosolisme, désenclavement des territoires périurbains et ruraux
- Facteurs de succès pour l'utilisation de la donnée:
- Besoin immédiat identifié
- Compétences existantes au sein du territoire
- Connaissance des données produites
- Volonté politique de l'élu
- Contraintes réglementaires (plans de mobilité, SERM, etc.)
- Trois axes d'étude :
- Gouvernance et cadres légaux
- Standards, plateformes, mécanismes d'accès
- Impact et utilisation réelle
- Approche en trois phases :
- Phase 1 : Collecte par revues documentaires, entretiens (dont MDS allemand), utilisation de l'IA
- Phase 2 : Analyse comparative entre pays avec fiches détaillées par pays
- Phase 3 : Synthèse et cartographie globale des pratiques
- Résultats préliminaires disponibles, notamment sur l'Allemagne
- L'Allemagne présente des plateformes multi-niveaux basées sur des standards communs (GTFS) avec une bonne ouverture des données
- Travail important d'ingénierie documentaire avec Gemini et ChatGPT
- Développement de prompts complexes avec souci de fiabilité et gestion des biais
- L'ampleur géographique et la quantité de données rendaient impossible ce travail sans IA
- Utilisation de MCP (Model Context Protocol) pour interroger Data.gouv et autres sources
- Les sources sont classées (scientifiques, techniques, etc.) avec références bibliographiques vérifiables
- Ce travail pourrait alimenter des publications scientifiques et des thèses
- Inventaire des données sur GRIST (accessible publiquement, contributif) : https://grist.numerique.gouv.fr/o/docs/tSEqeqXSZaRw/donnees-et-mobilite
- Wiki collaboratif pour description détaillée des données
- Travail exemplaire réalisé sur les données vélo avec sources et limites
- Glossaire des données de mobilité pour harmoniser le vocabulaire
- Plateforme Expertise et Territoire pour la communauté d'acteurs, gérée par Patrick Gendre
- Architecture par mots-clés pour faciliter la recherche
- Centre de ressources alimenté par les livrables
- Échelle territoriale : Les bassins de mobilité sont l'échelle pertinente pour le partage de données
- Portail de partage : Intérêt pour un portail territorial inspiré du portail de recherche Mob Sci-dat Factory
- Centre de ressources : Questionnement sur l'intérêt pour les chercheurs, étudiants, et possibilité de contribution
- Cas d'usage complets : Possibilité d'articuler différentes briques algorithmiques et de proposer des projets collaboratifs
- Forum données et mobilité : Proposition de relancer un forum type PREDIT pour échanger entre chercheurs, collectivités et opérateurs
- Dimension internationale : Question de la création d'infrastructures de données mondiales pour la mobilité, comme en climatologie
- Nassima se rendra à Istanbul fin du mois pour le congrès ITS (Ertico)
- Nécessité de créer des connexions entre l'inventaire GRIST et les moissonneurs existants sur le portail
- Importance d'avoir des discussions dynamiques sur les données
- Travail de mutualisation à faire sur le glossaire
- Les solutions algorithmiques doivent être référencées sur le portail avec un template standardisé inspiré de la fiche de Thibaut
- Deux grandes familles de cas d'usage identifiées :
- Cas d'usage métier/opérationnel : besoin de données récentes (stationnement, régulation, transport public)
- Cas d'usage de planification/modélisation : études à plus long terme, observatoires
- Les répondants utilisent généralement plusieurs types de données selon leur profil
- Questionnement sur l'aspect dynamique et la mise à jour continue des données vs. études ponctuelles
- Les observatoires (obligatoires pour les AOM) font du suivi avec mise à jour annuelle ou mensuelle
-
Exemple de travail sur l'occupation des sols avec ontologie et tentative d'extraction via LLM
-
Constat : les modèles actuels ne permettent pas encore une extraction automatique fiable
-
Piste de recherche prometteuse pour permettre des requêtes automatiques du type "je veux cette donnée pour calculer cet indicateur"