IntroductionTandis que les approches d’apprentissage automatique (c.-à-d., « machine learning ») sont de plus en plus utilisées en prédiction, leurs applications en inférence causale sont plus récentes. Nous proposons une approche combinant la G-computation et l’apprentissage automatique pour estimer l’effet causal d’une exposition binaire sur un évènement binaire.MéthodesNous avons évalué et comparé, via une étude de simulation, les performances de régressions logistiques pénalisées, d’un réseau de neurones, d’une machine à vecteurs de support, d’une classification renforcée, d’arbres de régression et d’un « super learner ». Nous avons étudié six scénarios différents faisant varier les tailles d’échantillon et les relations entre les covariables, l’exposition binaire et l’évènement binaire.RésultatsL’utilisation dusuper learnerpour spécifier le modèle de nuisance de la G-computation surpassait les autres approches en termes de biais ou de variance lors de l’estimation de l’effet causal, particulièrement pour les tailles d’échantillon modérées. L’utilisation de la machine à support de vecteurs permettait également d’obtenir des estimations causales performantes, bien que le biais moyen fût légèrement plus élevé qu’avec lesuper learner.ConclusionL’utilisation d’approches d’apprentissage automatique peut être pertinente en inférence causale. Contrairement à une idée reçue, ceci est également vrai pour des tailles d’échantillon constituées d’une centaine d’individus comme dans la majorité des études médicales. La G-computation avec lesuper learnerest disponible dans le package R RISCA.