Une sélection de ressources (articles scientifiques, billets et autres liens) en lien avec les thématiques du DéSaN : entrepôts de données de santé, modèles de langage et, plus généralement, sciences de l’information dans le domaine de la santé. Ces ressources ont été repérées durant le mois de novembre 2025.
Cette veille existe également sous la forme de pages Wakelet et Zotero.
Thèmes Principaux et Idées Clés (réalisé avec Google NotebookLM)
I. Applications Cliniques et Évaluation des LLMs
- Angus D.C., Khera R. et al. – AI, Health, and Health Care Today and Tomorrow – The JAMA Summit Report on Artificial Intelligence : Cet article souligne le marché croissant des outils d’IA en santé, le manque d’évaluation de leurs effets sur la santé, et le besoin d’une réglementation limitée et d’infrastructures de données robustes. https://doi.org/10.1001/jama.2025.18490
- Germani F, Spitale G. – Source framing triggers systematic bias in large language models : Cette étude évalue l’impact de l’attribution de la source (LLM ou nationalité) sur le biais des modèles de langage lors de l’évaluation de leur accord avec des récits socialement sensibles. https://doi.org/10.1126/sciadv.adz2924
- Gosak L, Štiglic G, Tam WWS, et al. – Human-led and artificial intelligence-automated critical appraisal of systematic reviews: Comparative evaluation : Cette étude compare la performance de cinq grands modèles de langage (LLMs) à celle d’évaluateurs humains pour l’évaluation critique de revues systématiques en soins infirmiers. https://doi.org/10.1016/j.nepr.2025.104614
- Metzner C, Gao S, Herrmannova D, et al. – Deformable phrase level attention: A flexible approach for improving AI based medical coding : Cet article propose le mécanisme Deformable Phrase-Level Attention (DPLA) pour améliorer l’encodage médical automatisé et l’extraction d’informations critiques à partir de documents cliniques (EHRs, rapports SEER). https://doi.org/10.1016/j.artmed.2025.103299
- Qiu P. et al. – MedR-Bench: The first benchmark specifically designed to evaluate the medical reasoning capabilities of state-of-the-art LLMs : MedR-Bench est un benchmark complet basé sur 1453 cas cliniques structurés qui évalue le raisonnement médical des LLMs dans les domaines du diagnostic, du traitement et des recommandations d’examens. https://doi.org/10.1038/s41467-025-64769-1
- Pratte M, Thirukumar S, Zhang C, et al. – Can large language models approximate the results of meta-analyses in critical care? A meta-research study : Cette méta-étude évalue la capacité des LLMs (DeepResearch) à approximer les résultats (taille de l’effet, notation GRADE) d’analyses systématiques et de méta-analyses en soins intensifs. https://doi.org/10.1016/j.jcrc.2025.155358
- Shao C, Snyder D, Li C, et al. – Scalable Medication Extraction and Discontinuation Identification from Electronic Health Records Using Large Language Models : Cette étude évalue 12 LLMs pour l’extraction de médicaments et l’identification de leur statut d’arrêt à partir des dossiers de santé électroniques (DSE). https://doi.org/10.1016/j.jclinepi.2025.112049
II. Méthodologies d’Optimisation des Modèles et PNL Biomédicale
- Fang L, Yu X, Cai J, et al. – Knowledge distillation and dataset distillation of large language models: emerging trends, challenges, and future directions : Cette étude analyse les paradigmes complémentaires de Distillation de Connaissances (KD) et de Distillation de Datasets (DD) pour compresser les LLMs tout en maintenant leurs capacités de raisonnement, avec des applications en santé. https://doi.org/10.1007/s10462-025-11423-3
- Hasan MJ, Rahman F, Mohammed N. – OptimCLM: Optimizing clinical language models for predicting patient outcomes via knowledge distillation, pruning and quantization : OptimCLM est un framework visant à optimiser les Modèles de Langage Cliniques (CLMs) pour la prédiction des résultats des patients via la distillation de connaissances et la compression. https://doi.org/10.1016/j.ijmedinf.2024.105764
- Yang T, Xiao Y, Bao Z, et al. – The rise and potential opportunities of large language model agents in bioinformatics and biomedicine : Cette revue passe en revue les agents LLM en bioinformatique et en biomédecine, détaillant leur architecture, leurs applications (diagnostic, développement de médicaments) et les défis éthiques et techniques qu’ils posent. https://doi.org/10.1093/bib/bbaf601
- Li M, Zhan Z, Yang H, et al. – Benchmarking retrieval-augmented large language models in biomedical NLP: Application, robustness, and self-awareness : Cette étude évalue les modèles de langage augmentés par récupération (RALs) dans les tâches de PNL biomédicale pour mesurer leur efficacité à réduire les hallucinations en utilisant des bases de connaissances externes comme PubMed. https://doi.org/10.1126/sciadv.adr1443
III. Éthique, Éducation et Implémentation de l’IA en Santé
- Abdulnour R-E, . Educational Strategies for Clinical Supervision of Artificial Intelligence Use : Cet article explore l’impact et l’intégration de la littératie IA dans l’éducation médicale. http://doi.org/10.1056/NEJMra2503232
- Haute Autorité de Santé (HAS) – Premières clefs d’usage de l’IA générative en santé : Ce guide de la HAS fournit les premières clés pour un usage raisonné de l’IA générative en santé, structurées autour des lignes directrices A.V.E.C. (Apprendre, Vérifier, Estimer, Communiquer). https://www.has-sante.fr/jcms/p_3703115/fr/premieres-clefs-d-usage-de-l-ia-generative-en-sante
- Itani A, Gronseth SL, Musaad S, et al. – Ethical considerations for teaching with artificial intelligence: a scoping review in medical education settings : Cette revue de la littérature examine les considérations éthiques (confidentialité, biais, transparence algorithmique) liées à l’enseignement avec l’IA dans l’éducation médicale. https://doi.org/10.1186/s41239-025-00563-9
- Izquierdo-Condoy JS, Arias-Intriago M, Tello-De-la-Torre A, et al. – Generative AI and Critical Thinking in Medical Education : Cet article de perspective évalue l’impact de l’IA générative sur la pensée critique dans la formation médicale, soulignant le risque de dépendance cognitive et la nécessité d’une intégration éthique. https://doi.org/10.2196/76340
- Steiner J.F. – Generative AI in Scientific Writing: Temptation, Efficiency, and the Risk of Dependence : Cet article discute du rôle de l’IA générative dans la rédaction scientifique (par exemple, le résumé d’abstracts) et du risque de dépendance pour les chercheurs ayant peu de formation en écriture. https://doi.org/10.1001/jamainternmed.2025.6078.
IV. Infrastructure Documentaire et Recherche d’Information
- [Bouchard] – Sortir de Google Scholar, Scopus ou Web of Science: Que valent Lens, Dimensions, OpenAlex et Matilda pour la recherche bibliographique? : Cette ressource compare les outils de recherche bibliographique académique (Google Scholar, Scopus) aux méga-index freemium (Lens, Dimensions) et aux initiatives ouvertes (OpenAlex, Matilda). https://urfist.chartes.psl.eu/ressources/sortir-de-google-scholar-scopus-ou-web-science-que-valent-lens-dimensions-openalex-et
- ZB MED – Informationszentrum Lebenswissenschaften – Data Quality Made Visible: Pubservatory Highlights PubMed Updates : Pubservatory est un nouvel outil de ZB MED qui rend visible la curation continue (ajouts et suppressions) de la base de données PubMed pour assurer l’intégrité des données. https://www.zbmed.de/en/about/press/latest-news/article/pubservatory-data-quality-made-visible
- Kysh L, Baker Z, Bogucka R, et al. – Developing and validating infant hedges for PubMed and Ovid MEDLINE: a Medical Library Association Pediatric Librarians Caucus initiative : Ce projet de bibliothécaires décrit la méthodologie de développement et de validation de filtres de recherche sensibles pour la population infantile dans PubMed et Ovid MEDLINE. https://doi.org/10.5195/jmla.2025.2034
- Müller A, Wündisch E, Wirth FN, et al. – The Advanced Confidentiality Engine as a Scalable Tool for the Pseudonymization of Biomedical Data in Translational Settings: Development and Usability Study : L’article présente l’Advanced Confidentiality Engine (ACE), un service de pseudonymisation open-source hautement évolutif conçu pour la recherche biomédicale translationnelle et la gestion des liens protégés. https://doi.org/10.2196/71822
- Trip Database Blog – What Is Vector Search : Cette ressource explique la recherche vectorielle (Vector Search), qui trouve la signification sémantique des mots, améliorant la recherche en langage naturel pour l’extraction de preuves et l’IA. https://blog.tripdatabase.com/2025/11/05/what-is-vector-search/
- Shankar R, Qian X. – Context is King: From Prompt Engineering to Context Engineering in Healthcare AI : Ces extraits répertorient les composants fondamentaux pour l’ingénierie de contexte en santé, y compris différents types de données (laboratoire, imagerie, génomique) pour les systèmes IA. https://doi.org/10.2139/ssrn.5365971