Description : L’absence de randomisation pour les données de vie réelle complique l’analyse statistique
et nécessite l’utilisation de méthodes complexes. L’application web Plug-Stat facilitece
type d’analyse en proposant des interfaces intuitives pour les non-spécialistes. La
présente thèse cherche à optimiser Plug-Stat en automatisant le plus possible l’étape
d’estimation causale. Trois travaux étudiant le comportement de ces méthodes et un
quatrième proposant un outil d’aide à la décision sont présentés. Le premier travail
compare par simulations les méthodes d’inférence causale les plus courantes selon
différents ensembles d’ajustement. Le second travail compare différentes approches
de machine learning en combinaison avec la g- computation pour éviter les biais liés
à une mauvaise spécification du modèle. Le troisième travail présente le développement
d’un estimateur de g-computation en présence de censure à droite. Ce nouvel estimateur
est également combiné avec un score de propension pour former un estimateur doublement
robuste. Ces trois méthodes sont ensuite comparées par simulations. Le dernier travail
propose un algorithme d’aide à la vérification de l’hypothèse de positivité. Au final,
la g-computation semble être une méthode à considérer pour l'automatisation de Plug-Stat
. Elle ne nécessite pas d'hypothèse d'équilibre et le machine learning évite les problèmes
de spécification. Enfin, la vérification de la positivité est automatisée au moyen
d'arbres de décision pour permettre à l’investigateur de redéfinir sa population d'étude.;