Une sélection de ressources (articles scientifiques, billets et autres liens) en lien avec les thématiques du DéSaN : entrepôts de données de santé, modèles de langage et, plus généralement, sciences de l’information dans le domaine de la santé. Ces ressources ont été repérées durant les mois d’août et septembre 2025.
Cette veille existe également sous la forme de pages Wakelet et Zotero.
Thèmes Principaux et Idées Clés (réalisé avec Google NotebookLM)
I. Modèles de Langage (LLMs) et Cadres Fondamentaux
Ce thème couvre la nouvelle génération de modèles, leurs capacités multilingues, leur architecture et leur évaluation générale dans le domaine biomédical.
- Apertus un modèle de langage multilingue, ouvert et transparent – EPFL: Présente Apertus, le premier grand modèle de langage open source et multilingue développé en Suisse pour une IA transparente et inclusive.
- Buess L, et al. From large language models to multimodal AI: a scoping review on the potential of generative AI in medicine.: Revue exhaustive sur l’IA générative en médecine, couvrant les modèles (LLMs et MLLMs), les jeux de données spécialisés et les métriques d’évaluation.
- Liu J, et al. Prompt Engineering in Clinical Practice: Tutorial for Clinicians.: Tutoriel sur l’ingénierie des prompts (ex. few-shot, Chain-of-Thought) pour améliorer l’efficacité et la sécurité des LLMs dans les applications cliniques.
- Savage T, et al. Fine-Tuning Methods for Large Language Models in Clinical Medicine by Supervised Fine-Tuning and Direct Preference Optimization: Comparative Evaluation.: Évaluation du fine-tuning DPO sur les LLMs pour quatre tâches cliniques fondamentales : classification, triage, raisonnement clinique et résumé de notes.
- Feng Y, et al. A retrieval-augmented knowledge mining method with deep thinking LLMs for biomedical research and clinical support.: Propose un cadre (BioStrataKG et IP-RAR) intégrant graphes de connaissances et LLMs pour l’extraction de connaissances biomédicales et le support clinique.
- Thelwall M, Jiang X. Is OpenAlex suitable for research quality evaluation and which citation indicator is best?: Utilisation d’OpenAlex pour l’évaluation de la qualité de la recherche et l’analyse de l’efficacité des indicateurs de citation.
II. Applications Cliniques et Systèmes d’Aide à la Décision (CDSS)
Ces ressources explorent l’intégration directe de l’IA dans les flux de travail cliniques, de la sécurité médicamenteuse à la documentation.
- Elmaleh Y, et al. Intelligence artificielle en anesthésie-réanimation : quoi de neuf en 2025 ?: Présente un panorama des applications de l’IA en anesthésie-réanimation (EEG, échoguidage, jumeaux numériques) et explore les enjeux éthiques et de validation.
- Hsu H-Y, et al. Extracting Clinical Guideline Information Using Two Large Language Models: Evaluation Study.: Évalue l’utilisation de deux LLMs (GPT-4o et Gemini-1.5-Pro) pour l’extraction de lignes directrices cliniques en pharmacogénomique (PGx) afin d’alimenter les CDSS.
- Ong JCL, et al. Large language model as clinical decision support system augments medication safety in 16 clinical specialties.: Utilisation d’un modèle de langage RAG et d’une stratégie de Chain-of-Thought comme système d’aide à la décision clinique (CDSS) pour renforcer la sécurité des médicaments.
- Small WR, et al. Evaluating Hospital Course Summarization by an Electronic Health Record-Based Large Language Model.: Évaluation du partenariat médecin-LLM (intégré au DME) pour la création de résumés de parcours hospitalier de haute qualité.
- Pasquariello LD, et al. Current and Future Applications of AI in EMS Training: A Scoping Review.: Revue systématique axée sur le rôle de l’IA dans l’éducation des services médicaux d’urgence (EMS).
- Singh S, et al. Advancing AMR Surveillance: Confluence of One Health and Big Data Integration : Converging One Health and Big Data for AMR.: Étude de la convergence de l’approche One Health et du Big Data pour faire progresser la surveillance de la résistance aux antimicrobiens (AMR).
III. LLMs et Revue Systématique (Synthèse des Preuves)
Ces documents décrivent comment les LLMs sont utilisés pour automatiser et améliorer les tâches chronophages de la revue systématique, allant du criblage à l’évaluation du risque de biais.
- Rashid M, et al. Role of Generative Artificial Intelligence in Assisting Systematic Review Process in Health Research: A Systematic Review.: Revue systématique sur l’utilisation de l’IA générative dans les différentes étapes des revues systématiques (criblage, extraction de données, évaluation du risque de biais).
- Wang Z, et al. A foundation model for human-AI collaboration in medical literature mining.: Présente LEADS, un modèle LLM spécialisé pour les revues systématiques, qui décompose les tâches de literature mining pour une collaboration homme-IA efficace.
- Wang Z, et al. Accelerating clinical evidence synthesis with large language models.: Décrit TrialMind, un pipeline basé sur l’IA et aligné avec PRISMA pour accélérer la synthèse des preuves cliniques.
- Dogra S, et al. Evaluating Large Language Models for Radiology Systematic Review Title and Abstract Screening.: Évaluation des modèles de langage (LLMs) pour le criblage de titres et d’abstracts dans les revues systématiques en radiologie.
- Janoudi G, et al. Validating Loon Lens 1.0 for Autonomous Abstract Screening and Confidence-Guided Human-in-the-Loop Workflows in Systematic Reviews.: Validation d’un outil (« Loon Lens 1.0 ») pour le criblage automatisé d’abstracts dans les revues systématiques, avec une approche homme-dans-la-boucle.
- Marques-Cruz M, et al. Use of artificial intelligence to support the assessment of the methodological quality of systematic reviews.: Les LLMs peuvent soutenir l’évaluation de la qualité méthodologique des revues systématiques en utilisant des outils validés.
- Taneri PE. Human Versus Artificial Intelligence: Comparing Cochrane Authors’ and ChatGPT’s Risk of Bias Assessments.: Utilisation et évaluation des LLMs pour l’évaluation du risque de biais (RoB 2) dans les revues systématiques.
- Sercombe J, et al. Evaluating a Customized Version of ChatGPT for Systematic Review Data Extraction in Health Research: Development and Usability Study.: Évaluation d’un GPT personnalisé (« Systematic Review Extractor Pro ») pour l’extraction de données dans le cadre de revues systématiques.
- Keplinger LE, et al. Assessment of Deep Research for dermatology literature reviews: Deep concern over the hype.: Évaluation de cinq modèles de recherche avancés (« Deep Research ») pour la rédaction de revues scientifiques.
- Goyal A, et al. Accuracy of artificial intelligence in meta-analysis: A comparative study of ChatGPT 4.0 and traditional methods in data synthesis.: Étude comparative évaluant la précision de ChatGPT 4.0 par rapport aux méthodes traditionnelles dans la synthèse de données pour les méta-analyses.
IV. Données de Santé, Confidentialité et Interopérabilité
Ces sources traitent des défis fondamentaux liés à la gestion des données massives (Big Data), à leur confidentialité et à l’interopérabilité nécessaire pour l’IA.
- Bockhacker M, et al. Lessons Learned From Building a Data Platform for Longitudinal, Analytical Use Cases and Scaling to 77 German Hospitals: Implementation Report.: Aborde l’approche de centralisation des données hospitalières pour la recherche et les défis réglementaires liés au stockage on-premise.
- Ford E, et al. What is the patient re-identification risk from using de-identified clinical free text data for health research?: Traite de l’éthique de l’utilisation des textes cliniques libres pour la recherche, insistant sur la dé-identification et le risque de ré-identification patient.
- de Barros Vanzin VJ, et al. LLM-based approaches for automated vocabulary mapping between SIGTAP and OMOP CDM concepts.: Utilisation des LLMs et de l’approche RAG pour la cartographie automatisée des terminologies médicales (SIGTAP et OMOP CDM) afin d’améliorer l’interopérabilité.
V. Analyse du Texte Clinique (NLP), Codage et Génération Synthétique
Ce groupe se concentre sur les techniques d’analyse du langage naturel appliquées aux dossiers patients, y compris la génération de données pour pallier les problèmes de confidentialité.
- Li X, et al. Deep learning for automatic ICD coding: Review, opportunities and challenges.: Revue systématique des méthodes d’apprentissage profond pour le codage automatique de la CIM (ICD), soulignant les défis et l’importance d’intégrer des connaissances auxiliaires.
- Sadoune S, et al. Automatic analysis of negation cues and scopes for medical texts in French using language models.: Étude sur l’analyse automatique des négations dans les textes médicaux en français, notamment les comptes rendus de radiologie.
- Ouzar Y, et al. Interpretable one-class classification framework for prescription error detection using BERT embeddings and dimensionality reduction.: Présente un cadre de classification interprétable pour la détection d’erreurs de prescription, utilisant les embeddings BERT et la génération de données synthétiques non valides.
- McMurry AJ, et al. Large Language Model Symptom Identification From Clinical Text: Multicenter Study.: Évaluation des stratégies de prompt et des pipelines de parsing des LLMs pour l’identification de symptômes dans les notes de service d’urgence.
- Guerra-Adames A, et al. Génération de données de santé synthétiques : état de l’art en vue de la classification des mécanismes des traumatismes.: Présente une revue et une approche hybride pour la génération de données médicales synthétiques (tabulaires et textuelles via LLMs) afin d’assurer la reproductibilité et la confidentialité.
- Ducel F, et al. “Women do not have heart attacks!” Gender Biases in Automatically Generated Clinical Cases in French.: Décrit l’utilisation de LLMs multilingues (français) pour générer des cas cliniques synthétiques et évaluer les biais de genre.
VI. Gouvernance, Stratégie et Défis Institutionnels
Cette catégorie fournit un contexte essentiel sur l’adoption, le financement et les risques organisationnels et éthiques de l’IA dans les systèmes de santé publics.
- FHF – L’IA en santé : qui est le maître ?: Baromètre de la FHF sur l’adoption de l’IA dans les hôpitaux publics (diagnostic, efficacité opérationnelle, gestion) et les défis (financement, biais, données).
- Deng X, Li H. How large language models need symbolism.: Discussion sur la nécessité pour les grands modèles de langage d’intégrer le symbolisme.
- Naddaf M. AI tool detects LLM-generated text in research papers and peer reviews.: Publication traitant d’un outil d’IA capable de détecter les textes générés par des LLMs dans les articles de recherche et les revues par les pairs.