- Titre : Projet ICI — Utilisation d’un jumeau numérique pour des simulations épidémiologiques
- Présentateur : Maxime Colomb (INRIA - ASCII)
- Résumé : La plateforme ICI a pour objectif de simuler la diffusion d’épidémie au sein de modélisations détaillées de populations d’un espace géographique. Ce projet se compose d'un couplage de différents modules originaux. La modélisation de l’intérieur des bâtiments, la génération de populations synthétiques et la composition de flux de populations ont été réalisés à un niveau très précis grâce à des méthodes originales. L’attribution de lieux d’activités aux individus en fonction de leurs emplois du temps ; le module épidémiologique ; l’application de différents scénarios sanitaires modifiant les habitudes des individus ainsi que l’espace urbain sont réalisés de manière optimisée afin d'être répliqués un grand nombre de fois de manière systématique, notamment grâce à la plateforme OpenMOLE. Ma présentation abordera donc tous ces points en soulignant les parties réutilisables pour les partenaires du projet, ainsi que les améliorations qui pourraient être apportées par MobSciData-Factory.
- Sujet de recherche associé : Travaux antérieurs au projet
(*) Documents accesibles via l'authentification du portail MOBIDEC
Afficher le compte rendu
- Maxime Colomb, ingénieur de recherche à l'INRIA, chercheur invité au LASTIG (IGN, équipe Strudel), présente un modèle de propagation épidémique centré sur les individus
- Trois objectifs principaux du modèle : élaborer, évaluer et comparer les effets de multiples interventions sanitaires sur la diffusion d'épidémies ; comprendre l'échelle de transmission épidémique et les mécanismes efficaces pour les enrayer ; être utilisable par des épidémiologues non-informaticiens
- Particularités : modèle réaliste basé sur un jumeau numérique très précis du territoire, à l'échelle individuelle (comportement, état épidémiologique et localisation de chaque individu), très optimisé pour des analyses systématiques
- Collaboration entre l'IGN et l'INRIA depuis 4 ans, application actuelle sur les arrondissements de Paris avec déploiement prévu sur différentes métropoles françaises et potentiellement tout Paris
- Application épidémiologique : virus transmissibles en intérieur (SARS-CoV-2, ...)
- Simulations probabilistes à l'échelle individuelle : état épidémiologique et localisation de chaque individu
- Localisation des individus selon leur agenda dans les lieux du jumeau numérique à certaines heures
- Test probabiliste de contamination lors de rencontres entre individus contaminants et sains dans un même lieu, basé sur : type de lieu, type d'activité, virulence du virus, densité de surface
- Réplication par méthode Monte Carlo pour étude statistique robuste
- Trois types d'interventions sanitaires implémentées : protocoles sanitaires pour écoles (fermeture de classe au cas par cas ou globale selon taux d'incidence), confinements (modulables par zone ou type de population), campagnes de vaccination
- Pour le 4ème arrondissement : 1,25 million d'individus (résidents et transitant), simulation de 100 jours en environ 100-105 secondes sur ordinateur portable
- Simulateur implémenté en Julia pour optimiser les performances
- Environ 45% du temps de calcul consacré à la localisation des individus
- Optimisation : simulation uniquement des individus sains ou contagieux (pas les guéris ou immunisés)
- Focus sur l'intérieur des bâtiments comme lieu principal de diffusion épidémique pour les maladies transmises par aérosols
- Modèle appliqué à toute la France, historicisé depuis 2008 (création BD Topo), article en cours de finalisation
- Trois étapes du processus : groupement de bâtiments selon continuité fonctionnelle (utilisation adresses postales et parcelles), recensement et fusion des activités (sources : SIREN, BPE de l'INSEE, OpenStreetMap, APUR pour Paris), attribution de caractéristiques
- Deux types de lieux : logements (information BD Topo) et activités (toute activité recensée dans un bâtiment)
- Générateur sur 4 couches hiérarchiques : bâtiments/logements → ménages → individus
- Contraintes variables pour chaque niveau, plus complexes pour les individus (composition du ménage)
- Originalités : population fortement géolocalisée (empreinte géographique précise du bâtiment), configurations très hiérarchisées, utilisation de contraintes statistiques macro (zone d'études) et à l'échelle des iris
- Méthode de rejet stochastique, flexible aux données disponibles et différentes générations d'attributs
- Bonnes reproductions statistiques
- Objectif : pour chaque individu, chaque heure et jour de simulation, affecter une activité et une localisation (intérieur ou extérieur de la zone d'études)
- Réalisé en deux parties : framework général (calculé une fois, implémenté en Java) + simulation quotidienne (implémenté en Julia)
- Framework couvre trois aspects : entrées/sorties de zone, génération d'agendas, localisation fine
- Deux types de flux : pendulaires pour activités principales (travail, études, école) et occasionnels pour activités secondaires (courses, loisirs, visites)
- Données utilisées : EGT (Étude Globale de Transport), informations du jumeau numérique (population, emplois, places à l'école), comptages RATP, données mobiles pour calibration
- Avantages : flux entrants/sortants heure par heure, jour par jour avec profils sociodémographiques détaillés
- Inconvénients : faible potentiel de réutilisation hors projet (données très spécifiques), hypothèses avec extrapolations importantes et simplifications (ex: profils transport en commun)
- Chaîne de Markov plutôt libre : pour chaque heure, possibilité de passer de n'importe quelle activité à une autre parmi 8 activités modélisées (maison, travail, shopping, loisirs, visites, tâches administratives, santé, restaurant)
- Calibration EGT selon : classe d'âge, occupation, statut socio-professionnel, zone d'habitat (Paris/petite couronne/grande couronne), heure du jour, jour de semaine
- Tranches horaires actuelles de 2h, prévues de passer à 30 min pour plus de réalisme (augmente temps simulation)
- Avantages : tous cas de figure représentés (travail de nuit, week-end, salle de sport le matin, etc.), calibration possible avec autres enquêtes ménage-déplacement
- Limites importantes : certaines catégories de population insuffisamment représentées dans EGT, pas de mémoire/habitudes dans les agendas (ex: alternance nuit/jour non représentée), résultats parfois trop libres (départs du travail trop tôt)
- Validation macroscopique OK (statistiques agrégées similaires à EGT) mais comportements microscopiques parfois irréalistes
- Matrices origine-destination pour chaque agrégat statistique : probabilité de rester, d'aller vers autre agrégat ou de sortir de zone
- Matrices générées pour chaque tranche horaire de simulation
- Une fois agrégat sélectionné, tirage aléatoire d'un lieu correspondant à l'activité au sein de l'agrégat
- Calibration avec données de téléphonie mobile
- Avantages : calibration possible avec autres sources de données (besoin de matrices OD)
- Inconvénients : nécessite accès à données téléphonie mobile (partenariats), problématique lors du passage à l'échelle
- Plateforme OpenMOLE pour exploration du modèle : distribution sur infrastructures de calcul haute performance, algorithmes d'exploration (analyses de sensibilité, validations, optimisations)
- Exemple d'optimisation : protocoles sanitaires écoles optimisés selon durée de mesure et seuil d'application, minimisant contaminations totales et jours manqués/confinement
- Résultats montrent clusters de solutions optimisées avec déclenchement rapide réduisant population infectée, impact variable selon virulence virus et arrondissement
- Portail de visualisation de résultats précalculés : comparaison sous-populations, indicateurs épidémiologiques et non-épidémiologiques (tests réalisés, visites annulées)
- Partenariat avec équipe Géovis (IGN) pour indicateurs spatio-temporels à venir
- Généraliser le module de localisation à l'ensemble du territoire français (modules bâtiments et population synthétique déjà généralisables)
- Travailler sur la modification du comportement des individus : impact de la connaissance d'épidémie, état épidémiologique personnel, contraintes sanitaires (confinement, couvre-feu) sur habitudes de déplacement
- Projet safe city map porté par INRIA et INSA Lyon
- Passage à échelle plus large : échantillonnages statistiques vs simulations individuelles, simulations asynchrones d'arrondissements, dialogue entre individus changeant d'arrondissement
- Publier les codes en open-source après publication des articles scientifiques
- Diffuser toutes les données générées prochainement
-
Ouverture à réutilisation de méthodes, outils et données de la toolbox du PEPR
-
Mise à disposition des codes open-source une fois articles publiés
-
Collaboration avec Inserm sur application du modèle en épidémiologie d'intervention et anticipation de maladies émergentes
-
Travail prévu avec le jumeau numérique national