Les dossiers patients, issus de Cortexte, sont présentés sous format textuel.
Afin d’extraire au mieux les informations sur les patients et les maladies, les chercheurs se sont basés sur des outils déjà existants dont l’Extracteur de Concepts Multi-Terminologue (ECMT*), qui a été développé au D2IM (CHU de Rouen) et Doc’EDS, outil de recherche sur les documents de santé d’un entrepôt de données de santé.
L’ECMT utilise des Systèmes d’Organisation des Connaissances (SOC*) à travers HeTOP*, fondé sur des algorithmes proches des sacs de mot et utilisé pour fouiller les dossiers patients.
Le but durant ce projet est de tester (exécuter les requêtes) et de mettre en œuvre l’architecture la plus efficace (pour la fouille de texte).