Depuis le début de la pandémie Covid-19, différentes approches coexistent pour modéliser la propagation du virus et l’effet des mesures de distanciation sociales. Jusque-là le modèle qui faisait autorité était celui présenté par Neil Ferguson de l’Imperial Collège de Londres. Cette modélisation qui a influencé les décisions des gouvernements britanniques et américains début mars 2020 repose sur une approche épidémiologiste. Récemment, de nouvelles modélisations développées par des Data Scientists, à l’instar du modèle CAST développée par deux entrepreneurs lyonnais, Denis et Manuel Capel, ont fait leur apparition et bouleversé les projections établies.
Plongée dans l’univers opaque et stratégique des hommes qui murmurent à l’oreille des politiques
Le modèle développé par Neil Ferguson, épidémiologiste et mathématicien à l’Imperial College de Londres est le plus connu. Début mars 2020, Neil Ferguson a présenté aux membres du gouvernement les résultats des modèles mis au point par son équipe pour simuler la propagation du coronavirus dans la population britannique. A la suite de la présentation de ces résultats, le Premier ministre britannique, Boris Johnson, a annoncé des restrictions rigoureuses sur les déplacements des personnes. Les gouvernements américain et français se sont également largement basés sur ces prédictions lors de la mise en place des consignes de distanciation sociale mi-mars 2020. « Les gouvernements du monde entier s’appuient sur des projections mathématiques pour guider leurs décisions face à cette pandémie. Les simulations informatiques ne représentent qu’une partie des analyses effectuées par les équipes de modélisation durant cette crise mais elles constituent un élément de plus en plus important dans l’élaboration des politiques » témoignait Neil Ferguson en mars 2020.
De la difficulté de prédire l’évolution de l’épidémie de Covid-19
Oui mais voilà. Si les modélisations de Neil Ferguson se sont montrées d’une grande aide quand il s’est agi de prendre des décisions urgentes et drastiques, elles ont atteint leurs limites quand il s’est agi de se projeter avec des états initiaux différents et de multiples options nationales et locales. Il faut dire que nombreuses informations sur la façon dont le virus se propage sont encore inconnues et doivent être estimées ou supposées, ce qui limite la fiabilité et la précision des prédictions. Une version antérieure du modèle de l’Imperial College estimait que le Covid-19 serait du même ordre de gravité que la grippe en termes d’hospitalisations. Cette estimation s’est évidemment révélée incorrecte.
Modéliser avec précision l’évolution de l’épidémie de Covid-19 reste effectivement difficile, comme s’en est alarmé le CHS (Center for Health Sécurité) dans son récent rapport. La création d’un centre national de « Outbreak Sciences » (Sciences des irruptions épidémiques) a d’ailleurs été évoqué. Au-delà des limites scientifiques liées à de telles prédictions, le rôle des médias doit également être souligné. Certains médias ont en effet traité les prédictions de l’Imperial College de Londres comme des Oracles des Dieux, à l’image du New York Times qui a accepté les prédictions de Neil Ferguson et les a présentées comme un fait avéré au sein de son éditorial.
L’IA permet une modélisation plus fine des effets du dé-confinement
Pour Manuel Capel, co-fondateur de Parcoor, startup DeepTech qui est à l’origine d’une nouvelle modélisation pour simuler l’impact des différents scénarios de déconfinement sur l’évolution de l’épidémie regardée de prêt par le Ministère de l’Intérieur français, « les outils de modélisation classiques des épidémies type SEIR ont montré leur limite car ils ne permettent pas de réaliser des simulations avec une granularité assez fine ».
Il poursuit : « Autant la décision du confinement pouvait être prise de manière efficace avec des simulations du type de l’étude de l’Impérial College de Londres car il s’agissait d’un tout ou rien, autant le dé-confinement semble être plus problématique à modéliser compte tenu de la multitude de paramètres en jeu. »
Tous les départements ne sont pas logés à la même enseigne et connaissent des conditions de dé-confinement différentes (ouverture ou non des plages, des parcs, des écoles, mise en place du télétravail, port du masque en dehors des zones obligatoires, etc.) C’est partant de ce constat que le data scientist a mis au point un outil permettant non pas de modéliser au sens mathématique (ajuster des courbes statistiques) mais de simuler les comportements d’une population pour en comprendre l’évolution. A la différence des modèles classiques de type SEIR utilisés par les épidémiologistes, cette approche modélise l’humain avec son comportement (à l’arrêt, en mouvement), le lieu dans lequel il évolue à l’instant t (chez lui, en dehors (dans différentes situations et densités)) et son état à l’instant t (sain, asymptomatique, symptomatique, mort, guéri) de manière itérative.
« La modélisation CAST est plus performante que les modèles prédictifs types SIER qui faisaient auparavant autorité car elle permet une granularité bien plus fine. C’est en effet le seul modèle capable de voir ce qu’il se passe à l’échelle locale ” résume Denis Capel, co-fondateur de la startup Parcoor.
Optimiser les prédictions de propagation du virus grâce au machine learning
Le modèle CAST a été défini de façon à contenir suffisamment de paramètres pour pouvoir modéliser finement la réalité, sans toutefois avoir trop d’informations qui rendrait son optimisation très difficile. « Nous avons utilisé les techniques mathématiques sous-jacentes aux algorithmes de machine learning communément utilisée dans l’intelligence artificielle » explique le Manuel Capel le CTO. Ces techniques appelées « Gradient Descent », « GAN », « Lasso » permettent d’optimiser un nombre important de paramètres par itérations successives, de générer aléatoirement des valeurs de paramètres et de les tester ou encore de déterminer la corrélation de paramètres pour ne pas s’en encombrer inutilement.
« En utilisant des techniques classiques de simulation informatique couplées à des techniques mathématiques sous-jacentes aux machines learning, nous sommes en mesure de fournir des résultats plus conformes à la réalité et surtout d’argumenter les décisions » complète Denis Capel.
Ce modèle de prédiction de propagation de l’épidémie Covid-19 basé sur l’intelligence artificielle offre aux décideurs la possibilité de tester itérativement des hypothèses pour converger vers un scénario « acceptable » intégrant de multiples paramètres ou hypothèses permettant ainsi de juguler l’épidémie sans toutefois avoir besoin de mettre en œuvre des mesures drastiques comme le confinement mais des mesures fortes, argumentées et adaptées localement si besoin.