Description : Avec l'adoption généralisée des dossiers médicaux électroniques (DME), des quantités
de plus en plus importantes de données cliniques électroniques sont générées, ce qui
fait que les chercheurs, les administrateurs de soins de santé et les cliniciens s'intéressent
de plus en plus à l'utilisation de telles données. Le projet EDSaNCoh, sélectionné
et financé par le FEDER (Fonds européen de développement régional), vise à développer
une plateforme pour créer et alimenter automatiquement des e-cohortes prospectives.
L'objectif final du projet est d'optimiser la recherche non interventionnelle sur
les données épidémiologiques et cliniques en réduisant les erreurs humaines, la charge
de travail, la complexité de la saisie des données et le temps consacré à la collecte
des données par rapport aux méthodes de recherche actuelles, ce qui se traduit finalement
par une réduction des coûts. Le premier projet tirant parti de l'infrastructure EDSaNCoh
est EDILS2.0 (Eating Disorders Inventory Longitudinal Study) dont l'objectif principal
est d'identifier, 2 et 5 ans après une première consultation pour Trouble du Comportement
Alimentaire (TCA), les facteurs pronostiques de guérison, de rémission, de changement
de type de trouble alimentaire et de décès ou suicide. METHODOLOGIE : Trois sont les
sources de données combinées par l'infrastructure EDSaNCoh : l'entrepôt de données
de santé du CHU de Rouen, le SNDS (système national des données de santé), et des
questionnaires auto-administrables directement envoyés aux patients. Afin d'évaluer
les capacités de l'algorithme construit pour EDILS2.0 à identifier correctement les
patients répondant aux critères d'inclusion et à récupérer correctement les variables
ciblées, ses performances ont été comparées automatiquement, sur un ensemble de documents
aléatoires, à un gold standard humain. RESULTATS : L'algorithme a donné de bons résultats,
atteignant 96 % de précision et 88,1 % de recall pour l'inclusion des patients. En
ce qui concerne ses capacités d'extraction de caractéristiques, il a obtenu, sur un
ensemble de 24 variables, une accuracy moyenne de 94,08%. CONCLUSION : Selon les résultats
préliminaires, EDILS2.0 montre une qualité de données très prometteuse, une qualité
qui est, je crois, encore améliorable. Les optimisations suggérées sont de nature
conservatrice, elles sont faciles à mettre en œuvre et ne nécessitent pas d'adaptations
des pratiques de travail, ce qui devrait se traduire par une mise en œuvre sans friction.
En cas de succès, elles feront passer la précision de l'algorithme d'extraction des
caractéristiques dans une zone de confiance, au-delà de la barre des 95 %, ce qui
est crucial pour la fiabilité des analyses futures. Tel résultat servira également
de manifeste des bons résultats que l'on peut obtenir avec les e-cohortes et de la
qualité du projet EDSaNCoh et favorisera l'intérêt pour cette technologie.;