1. Modeling and inference by an approach coupling filtering and stochastic algorithms for partially observed epidemic dynamics
- Author
-
Narci, Romain and STAR, ABES
- Subjects
Estimation paramétrique ,Filtre de Kalman ,Mixed effects models ,Algorithme SAEM ,SAEM algorithm ,Modèles à espace d'état ,Kalman filter ,Processus Gaussiens à petite variance ,Gaussian processes with small variance ,Modèles à effets mixtes ,[MATH.MATH-ST] Mathematics [math]/Statistics [math.ST] ,State space models ,Parametric estimation - Abstract
The context of this thesis is the inference for partially observed epidemic dynamics. The development of approaches for estimating parameters of these dynamics from observations of their follow-up is a first important challenge, but difficult from a statistical point of view. Indeed, the data are generally collected at discrete time points and subject to reporting and/or measurement errors. Additionally, the presence of unobserved components in the mechanistic models used to describe the epidemics requires the use of inference algorithms (latent variable model framework). Furthermore, multiple dynamics of the same epidemic event can be observed in different geographic locations or at different times. A second challenge is to explicitly take into account inter-epidemic variability in the modeling. We consider epidemic dynamics in fixed population size modeled by Markovian density-dependent jump processes. Through an approach based on their approximation by diffusion processes, the epidemic dynamics are described by Gaussian processes with small variance. Considering a Gaussian approximation of the observational model, we adopt the framework of the Gaussian state space models and linear in the system states. In these models, the likelihood of the observations can be obtained via Kalman filtering techniques that we combine with an optimization procedure to estimate the parameters. Then, in the case of multiple epidemics, we use the framework of the mixed effects models allowing to describe in a more refined and original way the different sources of variability between several data sets collected from multisite or recurrent epidemics. In these models, distributions are specified for the parameters, which allows to take into account the inter-epidemic variability. To estimate the parameters of these distributions, we combine Kalman filtering techniques and the stochastic SAEM algorithm. The different methods developed in this thesis are first assessed on simulated epidemic data sets described by Markovian jump processes. The implementation on real data concerns the daily incidence of influenza-like illness between 1990 and 2017 in France (recurrent epidemics) and hospital data related to Covid-19 in 12 regions of metropolitan France during spring 2020 (multisite epidemics)., Le cadre de cette thèse est l’inférence pour des dynamiques épidémiques partiellement observées. Le développement d’approches pour l’estimation de paramètres de ces dynamiques à partir des observations de leur suivi est un premier enjeu important, cependant difficile du point de vue statistique. En effet, les données sont généralement recueillies à des temps discrets et sujettes à des erreurs de report et/ou de mesure. A cela s’ajoute la présence de composantes non-observées dans les modèles mécanistes servant à décrire les épidémies, rendant nécessaire l’utilisation d’algorithmes pour l’inférence (cadre des modèles à variables latentes). Par ailleurs, des dynamiques multiples d’une même épidémie peuvent être observées dans des sites géographiques distincts ou à des périodes différentes. La prise en compte explicite de la variabilité inter-épidémies dans la modélisation constitue un deuxième enjeu. Nous considérons des dynamiques épidémiques en population de taille finie modélisées par des processus Markoviens de sauts dépendant de la densité. A travers une approche s’appuyant sur leur approximation par des processus de diffusion, les dynamiques épidémiques sont décrites par des processus Gaussiens à petite variance. En considérant également une approximation Gaussienne du modèle des observations, nous nous plaçons dans le cadre des modèles à espace d'état Gaussiens et linéaires en les états du système. Dans ces modèles, la vraisemblance des observations peut s'obtenir via des techniques de filtrage de Kalman, que nous combinons avec une procédure d'optimisation pour estimer les paramètres. Puis, dans le cas d'épidémies multiples, nous utilisons le cadre des modèles à effets mixtes permettant de décrire de façon plus fine et originale les différentes sources de variabilité entre plusieurs jeux de données recueillis à partir d'épidémies multisites ou récurrentes. Dans ces modèles, des distributions sont spécifiées pour les paramètres, ce qui permet de prendre en compte la variabilité inter-épidémies. Pour estimer les paramètres de ces distributions, nous combinons des techniques de filtrage de Kalman et l’algorithme stochastique SAEM. Dans un premier temps, les différentes méthodes développées dans cette thèse sont évaluées sur des jeux de données simulées d’épidémies décrites par des processus Markoviens de sauts. La mise en œuvre sur des données réelles porte sur l'incidence quotidienne de syndromes grippaux entre 1990 et 2017 en France (épidémies récurrentes) et les données hospitalières relatives à la Covid-19 dans 12 régions de la France métropolitaine pendant le printemps 2020 (épidémies multisites).
- Published
- 2022