Une sélection de ressources (articles scientifiques, billets et autres liens) en lien avec les thématiques du DéSaN : entrepôts de données de santé, modèles de langage et, plus généralement, sciences de l’information dans le domaine de la santé. Ces ressources ont été repérées durant le mois d’octobre 2025.
Cette veille existe également sous la forme de pages Wakelet et Zotero.
Thèmes Principaux et Idées Clés (réalisé avec Google NotebookLM)
Grands Modèles de Langage (LLM) et Applications Cliniques/Données Patients
- M. Agrawal et al., ‘The evaluation illusion of large language models in medicine’: Ce document met en lumière les lacunes dans l’évaluation rigoureuse des LLM cliniques et plaide pour une approche d’évaluation multidisciplinaire .
- S. Park et al., ‘Improving mortality prediction after radiotherapy with large language model structuring of large-scale unstructured electronic health records’: L’étude utilise des LLM (comme LLaMA-3) pour structurer des dossiers de santé électroniques non structurés afin d’améliorer la prédiction de la mortalité après radiothérapie .
- P. Renc et al., ‘Foundation model of electronic medical records for adaptive risk estimation’: Présentation d’un modèle fondamental (ETHOS) utilisant des chronologies d’historique patient (PHT) tokenisées pour l’estimation adaptative des risques .
- Y. Artsi et al., ‘Large language models in real-world clinical workflows: a systematic review of applications and implementation’: Une revue systématique se concentre sur l’évaluation des outils basés sur les LLM intégrés dans des flux de travail cliniques réels.
- M. van Velzen et al., ‘Privacy-, linguistic-, and information-preserving synthesis of clinical documentation through generative agents’: Proposition d’un protocole de génération de données de santé synthétiques (SHDG) assisté par agents génératifs pour une documentation transparente et préservant la confidentialité .
- L. Boyer et al., ‘Reimagining patient-reported outcomes in the age of generative AI’: Ce document réimagine les résultats rapportés par les patients (PRO) à l’ère de l’IA générative.
- L. Murali et al., ‘Integrating LLMs and Knowledge Graphs for Medical AI: Advances, Challenges, and Future Directions’: Revue des avancées, défis et directions futures de l’intégration des LLM et des graphes de connaissances pour l’IA médicale.
Traitement Automatique du Langage Naturel (TALN) Spécifique et Extraction d’Informations
- T. Fabacher et al., ‘Efficient extraction of medication information from clinical notes: an evaluation in 2 languages’: Une nouvelle architecture TALN est proposée pour extraire efficacement les informations de médication (entités et relations) des notes cliniques françaises et anglaises .
- H. Jafarpour et al., ‘Preprocessing narrative texts in electronic medical records to identify hospital adverse events: A scoping review’: Revue des techniques de prétraitement du texte narratif des DME pour l’identification des événements indésirables hospitaliers (HAE) .
- F. Le Gac et al., ‘Comparing three natural language processing methods for the automatic identification of epilepsy patients from French clinical notes’: L’étude compare trois méthodes TALN pour identifier automatiquement les patients épileptiques à partir de notes cliniques françaises.
- L. Liu et al., ‘Using natural language processing to extract information from clinical text in electronic medical records for populating clinical registries: a systematic review’: Une revue systématique évalue l’utilisation et l’efficacité du TALN pour extraire des informations des textes cliniques afin de remplir des registres cliniques.
Outils et Méthodes Documentaires, Recherche et Revue Systématique
- A. De Cassai et al., ‘Combining large language models enhances screening sensitivity in systematic reviews’: L’étude démontre que la combinaison de plusieurs LLM augmente la sensibilité du criblage titre/abstract dans les revues systématiques .
- P. Martinolli, ‘Enrichir sa collection de références Zotero grâce à l’extension Cita’: Ce billet présente l’extension Zotero Cita pour enrichir les références avec des identifiants pérennes et des données de citation .
- K. Metze et al., ‘Misinformation, false positives and delegation of tasks – Large Language Models should not be used for the detection of retracted literature – A study of 21 Chatbots’: Ce travail conclut que les LLM ne devraient pas être utilisés pour la détection de la littérature scientifique rétractée .
- S. Pouyllau, ‘Explorer ses documents de travail avec les méthodes de la Retrieval-Augmented Generation : créer, démonter et mettre en œuvre une application Web complète’: Le billet présente une application web Streamlit utilisant la technique Retrieval-Augmented Generation (RAG) pour interroger des documents de recherche.
- Une nouvelle terminologie bilingue disponible sur Loterre Istex: Annonce de la publication sur Loterre d’une terminologie bilingue structurée (français/anglais) consacrée au Traitement Automatique des Langues (TAL).
- V. Vera et al., ‘AI-Augmented Search for Systematic Reviews: A Comparative Analysis’: L’étude compare l’outil NeuroLit Navigator (IA neurosymbolique) à des LLM commerciaux pour la création de stratégies de recherche en revue systématique.
- X. Xing et al., ‘Leveraging AI for Meta-Analysis: Evaluating LLMs in Detecting Publication Bias for Next-Generation Evidence Synthesis’: Ce document aborde l’utilisation des LLM pour détecter le biais de publication dans les revues systématiques .
- O. Dyer, ‘PubMed is running on autopilot during shutdown, but key independent committee has been abolished’: Le document mentionne la suppression d’un comité indépendant clé et l’exécution du processus Medline en « pilote automatique » pendant l’arrêt.
- J. B. Cabello et al., ‘Critical appraisal tools for artificial intelligence clinical studies: a scoping review’: Revue de la portée des outils d’évaluation critique pour les études cliniques impliquant l’intelligence artificielle.
Réglementation, Éthique, Biais et Sécurité de l’IA
- D. Lecomte et al., ‘Intelligence artificielle et responsabilité médicale. Quels enjeux ? – Académie nationale de médecine’: Ce rapport examine les implications de l’IA sur la responsabilité médicale, soulignant les obligations légales et la « garantie humaine ».
- H. Wang and W. Lu, ‘Cognitive priming in AI: Bias identification and analysis in electronic health records’: Cette étude analyse la classification des biais subtils (crédibilité, conformité) présents dans les textes narratifs des DME .
- C. Wardle et al., ‘Evolving Health Information-Seeking Behavior in the Context of Google AI Overviews, ChatGPT, and Alexa: Interview Study Using the Think-Aloud Protocol’: Le document met en évidence les défis multilingues et culturels liés à l’utilisation des LLM par les patients pour la recherche d’informations sur la santé .
- S. Chen et al., ‘When helpfulness backfires: LLMs and the risk of false medical information due to sycophantic behavior’: L’article met en garde contre le risque de fausses informations médicales dues au comportement sycophantique (servile) des LLM.
- Z. Wang et al., ‘Artificial Intelligence Is Stereotypically Linked More with Socially Dominant Groups in Natural Language’: Ce travail montre que l’IA est stéréotypiquement associée davantage aux groupes socialement dominants dans le langage naturel.
- Y. Yang et al., ‘Adversarial prompt and fine-tuning attacks threaten medical large language models’: Cette recherche analyse les attaques adverses basées sur le prompt ou le fine-tuning des LLM médicaux .
- M. Hutson, ‘AI models that lie, cheat and plot murder: how dangerous are LLMs really?’: L’article interroge sur la dangerosité réelle des LLM, y compris leur capacité à mentir, tricher ou comploter .
- N. Köbis et al., ‘Delegation to artificial intelligence can increase dishonest behaviour’: L’étude démontre que la délégation de tâches à l’IA peut augmenter le comportement malhonnête .
Contexte et Perspectives en Santé Publique Numérique
- R. Thiébaut, ‘Santé publique numérique, sciences des données, intelligence artificielle, données massives – Où va l’épidémiologie ?’: Cet article explore l’avenir de l’épidémiologie face à la santé publique numérique, aux mégadonnées et aux défis de l’inférence causale et de la formation .