Libellé préféré : extraction d'informations;

Définition CISMeF : L'extraction d'information consiste à analyser des textes pour en obtenir des informations en vue d'une application précise, par exemple la recherche d'information dans un second temps.;

Détails


Consulter ci-dessous une sélection des principales ressources :

Vous pouvez consulter :

L'extraction d'information consiste à analyser des textes pour en obtenir des informations en vue d'une application précise, par exemple la recherche d'information dans un second temps.

N3-AUTOINDEXEE
Contributions à l'extraction d'information dans un entrepôt de données hospitalier : une aide pour la recherche clinique
https://tel.archives-ouvertes.fr/tel-03857962
Le développement des technologies numériques a conduit à la numérisation des informations médicales et à la dématérialisation des dossiers papiers en dossiers patients informatisés (DPI). Les données générées dans un hôpital contiennent des informations précieuses pour la recherche médicale. Les hôpitaux ont mis en place des entrepôts de données (EDS) pour faciliter l’utilisation secondaire des données. Dans un EDS, les chercheurs ont besoin d’identifier les patients éligibles à une étude clinique et de retourner au DPI pour remplir le cahier d’observation électronique d’une étude. La principale difficulté réside dans le caractère non structuré des informations médicales présentes sous forme de texte libre. Des méthodes de traitement automatique de la langue sont nécessaires pour structurer les données afin de faciliter leur interrogation et leur extraction. L’objectif de cette thèse était de développer des outils et des méthodes pour aider les chercheurs à mener des études de faisabilité et à trouver des informations dans un DPI. Les principales contributions de cette thèse sont les suivantes: une terminologie sur les médicaments en langue française. De nombreuses études s’intéressent à l’utilisation, l’efficacité et à la tolérance des médicaments en vie réelle. Les médicaments permettent aussi d’identifier certaines maladies. L’absence d’une terminologie normalisée du médicament a conduit à la construction de Romedi, référentiel ouvert du médicament, qui offre de bonnes performances pour détecter et identifier les médicaments dans les données hospitalières. Un annotateur sémantique scalable à un entrepôt de données. L’annotation sémantique consiste à relier des séquences de mots d’un document aux concepts d’une terminologie. Elle permet la détection et l’indexation de concepts médicaux. Comment indexer des millions de documents d’un EDS avec des terminologies médicales contenant plusieurs centaines de milliers de termes ? Dans ce travail, nous proposons un nouvel algorithme, IAMsystem, scalable à l’échelle d’un entrepôt de données et dont la complexité dépend peu de la taille d’une terminologie. Un inventaire de sens des abréviations médicales. Les abréviations sont largement utilisées en médecine. Elles ajoutent de la complexité aux tâches de traitement automatique de la langue et doivent être prises en compte par un annotateur sémantique. Ce travail présente deux algorithmes pour détecter automatiquement des abréviations à partir d’un corpus de documents médicaux et propose le premier inventaire d’abréviations issu de données hospitalières en langue française. [...]
2022
TEL - Thèses en ligne
France
thèse ou mémoire
Recherches
Aides à la recherche
extraction
Entreposage de données
soutien financier à la recherche comme sujet
extraction d'informations
recherche biomédicale
hôpital
extraction des données
hôpitaux

---
Nous contacter.
28/04/2024


[Accueil] [Haut de page]

© CHU de Rouen. Toute utilisation partielle ou totale de ce document doit mentionner la source.