Une sélection de ressources (articles scientifiques, billets et autres liens) en lien avec les thématiques du DéSaN : entrepôts de données de santé, modèles de langage et, plus généralement, sciences de l’information dans le domaine de la santé. Ces ressources ont été repérées durant le mois de juin 2025.
Cette veille existe également sous la forme de pages Wakelet et Zotero.
Thèmes Principaux et Idées Clés (réalisé avec Google NotebookLM)
1. Applications des Grands Modèles Linguistiques (LLM) en Santé Numérique
Ces sources mettent en lumière l’utilisation des LLM pour améliorer les processus cliniques, la recherche et l’extraction d’informations.
- Diagnostic et Aide à la Décision
- McDuff D, Schaekermann M, Tu T, et al. Towards accurate differential diagnosis with large language models. : Ce document évalue AMIE, un système d’IA basé sur les LLM, pour l’aide au diagnostic différentiel auprès de médecins généralistes, bien que les cliniciens l’utilisent moins fréquemment que les outils de recherche traditionnels comme UpToDate ou PubMed.
- Su H, Sun Y, Li R, et al. Large Language Models in Medical Diagnostics: Scoping Review With Bibliometric Analysis.: Cette revue de portée explore l’utilisation des LLM dans le diagnostic médical, couvrant la classification des maladies, la réponse aux questions médicales et la qualité du contenu généré, et notant un intérêt croissant pour les modèles de vision-langage pour l’interprétation de l’imagerie médicale.
- Zekaoui NE, Rhanoui M, Yousfi S, et al. SSMT-PANBERT: A single-stage multitask model for phenotype extraction and assertion negation detection in unstructured clinical text.: Cette étude propose une solution multi-tâches basée sur les Transformers pour l’extraction de phénotypes et la détection de la négation d’assertions à partir de notes cliniques.
- Recherche Clinique et Synthèse de Preuves
- Bazoge A, Wargny M, Constant Dit Beaufils P, et al. Assessing large language models for acute heart failure classification and information extraction from French clinical notes.: Cette étude évalue l’utilisation des LLM pour la classification des hospitalisations pour insuffisance cardiaque aiguë et l’extraction d’informations cliniques à partir de notes françaises.
- Huang J, Lai H, Zhao W, et al. Large Language Model-Assisted Risk-of-Bias Assessment in Randomized Controlled Trials Using the Revised Risk-of-Bias Tool: Usability Study.: Ce document examine la capacité des LLM à évaluer le risque de biais dans les essais contrôlés randomisés (ECR) pour les revues systématiques, en utilisant une approche basée sur des prompts structurés.
- Kartchner D, Turner H, Ye C, et al. TrialSieve: A Comprehensive Biomedical Information Extraction Framework for PICO, Meta-Analysis, and Drug Repurposing. : Ce travail introduit TrialSieve, un cadre complet pour l’extraction d’informations biomédicales PICO (Patient, Intervention, Comparaison, Outcome), la méta-analyse et le repositionnement de médicaments à partir de résumés PubMed.
- Ramchandani R, Guo E, Rakab E, et al. Validation of automated paper screening for esophagectomy systematic review using large language models.: Cette étude valide l’utilisation de LLM (GPT-4) pour le screening automatisé d’articles dans les revues systématiques, démontrant une performance prometteuse pour rationaliser le flux de travail et réaliser des économies de temps et de coûts.
- Sk V, O A, A E, et al. Do it faster with PICOS: Generative AI-Assisted systematic review screening. : Ce document évalue l’impact des résumés PICOS structurés générés par des LLM open-source sur la vitesse et la précision du screening des titres et résumés pour les revues systématiques.
- Wu S, Ma X, Luo D, et al. Automated literature research and review-generation method based on large language models. : Cette recherche propose une méthode automatisée de génération de revues littéraires basée sur les LLM, avec des stratégies efficaces d’atténuation des « hallucinations ».
- Extraction d’Informations Cliniques (Général)
- Du J, Wang D, Lin B, et al. Use of deep learning-based NLP models for full-text data elements extraction for systematic literature review tasks. : Ce document explore l’applicabilité des approches de traitement du langage naturel (NLP) pour l’extraction automatisée d’éléments de données à partir d’articles scientifiques complets pour les revues systématiques.
- Dong X, Zhao D, Meng J, et al. SyRACT: Zero-shot Biomedical Document level Relation Extraction with Synergistic RAG and CoT.: Cette étude présente SyRACT, un cadre pour l’extraction de relations au niveau du document biomédical en utilisant la génération augmentée par récupération (RAG) et la chaîne de pensée (CoT).
- Autres Applications Spécifiques
- Daccache N, Zako J, Morisson L, et al. The applications of ChatGPT and other large language models in anesthesiology and critical care: a systematic review.: Cette revue systématique examine les applications de ChatGPT et d’autres grands modèles linguistiques en anesthésiologie et en soins intensifs.
- AskTrip is live – automated clinical Q&A, instantly.: Ce document fait référence à « AskTrip », un outil de questions-réponses cliniques automatisé offrant une réponse instantanée. https://www.tripdatabase.com/ask
2. Défis et Considérations Éthiques liés aux LLM en Santé
Ces sources abordent les défis cruciaux liés à la confidentialité des données, aux biais et à la fiabilité des modèles d’IA en santé.
- Confidentialité des Données et Anonymisation
- F C, K C, G G, et al. Toward Identifying New Risk Aversions and Subsequent Limitations and Biases When Making De-identified Structured Data Sets Openly Available in a Post-LLM world. : Cette étude décrit les approches de dé-identification des données cliniques, soulignant les risques de ré-identification à l’ère des LLM et la nécessité d’une divulgation transparente.
- Morris JX, Campion TR, Nutheti SL, et al. DIRI: Adversarial Patient Reidentification with Large Language Models for Evaluating Clinical Text Anonymization. : Ce document introduit DIRI, une méthode contradictoire utilisant les LLM pour ré-identifier les patients à partir de notes cliniques anonymisées.
- Verkijk S, Vossen P. Creating, anonymizing and evaluating the first medical language model pre-trained on Dutch Electronic Health Records: MedRoBERTa.nl. : Cette publication détaille le développement de MedRoBERTa.nl, un LLM pré-entraîné sur des dossiers de santé électroniques néerlandais, en expliquant son processus d’anonymisation pour permettre une publication ouverte.
- Biais et Équité
- Kucukkaya A, Aktas Bajalan E, Moons P, et al. Equality, Diversity, and Inclusion in AI-Driven Healthcare Chatbots: Addressing Challenges and Shaping Strategies. : Cet article aborde l’importance d’intégrer les principes d’équité, de diversité et d’inclusion (EDI) tout au long du cycle de vie de l’IA dans les soins de santé, afin de remédier aux biais algorithmiques.
- Omar M, Soffer S, Agbareia R, et al. Sociodemographic biases in medical decision making by large language models.: Ce document se concentre sur l’atténuation des biais algorithmiques dans l’apprentissage automatique clinique et met à disposition des cas synthétiques et des données réelles dé-identifiées pour la recherche sur les biais sociodémographiques de l’IA.
- Hallucinations et Fiabilité
- Amugongo LM, Mascheroni P, Brooks S, et al. Retrieval augmented generation for large language models in healthcare: A systematic review. : Cette revue systématique des applications de la RAG pour les LLM en santé aborde les limitations des LLM comme les données obsolètes, la génération de contenu inexact (« hallucinations ») et le manque de transparence.
3. Développement et Évaluation de Modèles Linguistiques Spécifiques au Domaine Médical
Ces sources explorent les aspects techniques des LLM, y compris leurs architectures, méthodologies d’entraînement et les corpus de données utilisés.
- Architectures et Méthodologies
- Amugongo LM, Mascheroni P, Brooks S, et al. Retrieval augmented generation for large language models in healthcare: A systematic review. : Cette revue systématique des applications de la RAG pour les LLM en santé fournit un aperçu des différentes techniques de RAG (Naïve, Avancée, Modulaire) et de leur implémentation.
- Verkijk S, Vossen P. Creating, anonymizing and evaluating the first medical language model pre-trained on Dutch Electronic Health Records: MedRoBERTa.nl. : Cette publication détaille le développement de MedRoBERTa.nl, un LLM pré-entraîné sur des dossiers de santé électroniques (DSE) néerlandais, soulignant l’importance du pré-entraînement spécifique au domaine pour les tâches de NLP.
- Yuanyuan Z, Adel B, Mina B, et al. A scoping review of self-supervised representation learning for clinical decision making using EHR categorical data.: Cette revue examine l’apprentissage par représentation auto-supervisée (SSRL) pour la prise de décision clinique à partir de données catégorielles des DSE, identifiant les modèles basés sur les Transformers, les auto-encodeurs et les réseaux de neurones graphiques comme les principales tendances architecturales.
- Leiser F, Guse R, Sunyaev A. Large Language Model Architectures in Health Care: Scoping Review of Research Perspectives.: Cette revue examine les architectures de modèles LLM (basées sur BERT ou GPT) utilisées dans la recherche en santé, suggérant que les modèles basés sur GPT sont mieux adaptés aux communications et les modèles basés sur BERT à l’innovation.
- Données et Corpus
- Amugongo LM, Mascheroni P, Brooks S, et al. Retrieval augmented generation for large language models in healthcare: A systematic review. : Cette revue systématique met en évidence les divers ensembles de données médicales utilisés pour augmenter les réponses des LLM en santé, y compris les ensembles de données de questions-réponses et de récupération d’informations provenant de sources comme PubMed et UMLS.
- Kartchner D, Turner H, Ye C, et al. TrialSieve: A Comprehensive Biomedical Information Extraction Framework for PICO, Meta-Analysis, and Drug Repurposing. : Ce travail a introduit l’ensemble de données TrialSieve, un ensemble de données biomédicales complet et publiquement disponible, conçu pour améliorer l’extraction automatisée d’informations.
- Du J, Wang D, Lin B, et al. Use of deep learning-based NLP models for full-text data elements extraction for systematic literature review tasks. : Ce document décrit la création et le partage public de corpus annotés pour l’extraction d’éléments de données à partir d’articles complets dans les revues systématiques.
- OLSPub as an alternative to PubMed: Infrastructure made in Europe.: Ce projet vise à créer une base de données ouverte, fiable et durable pour les publications en sciences de la vie, servant d’alternative à PubMed en Europe.
4. LLM dans l’Éducation Médicale
Ces sources se concentrent spécifiquement sur l’intégration et l’évaluation des LLM dans le cadre de l’enseignement médical.
- Boscardin CK, Abdulnour R-EE, Gin BC. Macy Foundation Innovation Report Part I: Current Landscape of Artificial Intelligence in Medical Education. : Cette étude explore l’utilisation de l’IA dans l’éducation médicale, en cartographiant les domaines d’application et en identifiant les lacunes pour une intégration efficace.
- Cheng Y, Zhu L. A review of ChatGPT in medical education: exploring advantages and limitations. : Cette revue examine l’application de ChatGPT dans l’éducation médicale, y compris son évaluation pour la formation des patients et la préparation aux examens.
- Turner L et al. It Takes More Than Enthusiasm: The Missing Infrastructure to Unlock AI’s Potential in Medical Education. : Ce bref article mentionne la démystification de l’IA et son rôle futur dans l’évaluation de l’éducation médicale.