Une sélection de ressources (articles scientifiques, billets et autres liens) en lien avec les thématiques du DéSaN : entrepôts de données de santé, modèles de langage et, plus généralement, sciences de l’information dans le domaine de la santé. Ces ressources ont été repérées durant le mois de juillet 2025.
Cette veille existe également sous la forme de pages Wakelet et Zotero.
Thèmes Principaux et Idées Clés (réalisé avec Google NotebookLM)
Applications Cliniques Spécifiques des LLM
- Abdellaoui C, Redjdal A, Seroussi B. Generative-AI-Based Approaches for Information Extraction from Clinical Notes: A Scoping Review. : Ce document examine l’application des grands modèles linguistiques (LLM) pour l’extraction d’informations à partir de documents cliniques, en se concentrant sur les stratégies d’ingénierie des prompts et l’analyse comparative des performances .
- Isaradech N, Riedel A, Sirikul W, Kreuzthaler M, Schulz S. Zero- and few-shot Named Entity Recognition and Text Expansion in medication prescriptions using large language models. : Cette étude explore l’utilisation des LLM pour la reconnaissance d’entités nommées et l’expansion de texte dans les prescriptions de médicaments, soulignant l’importance de l’ingénierie des prompts .
- Williams CYK, Subramanian CR, Ali SS, Apolinario M, Askin E, Barish P, et al. Physician- and Large Language Model-Generated Hospital Discharge Summaries. : Cette étude évalue la capacité de GPT-4 à résumer des informations à partir de notes cliniques pour les transformer en narratifs de sortie d’hôpital, comparant sa qualité aux résumés humains .
- Xue J, Lu P. ICD code mapping model based on clinical text tree structure. : Cette étude présente un modèle de mapping des codes CIM (Classification Internationale des Maladies) basé sur la structure arborescente du texte clinique, détaillant le prétraitement des dossiers pour la classification automatique des codes .
- Zhou S, Xu Z, Zhang M, Xu C, Guo Y, Zhan Z, et al. Large language models for disease diagnosis: a scoping review. : Cette revue de portée examine l’utilisation des LLM pour le diagnostic des maladies, explorant les spécialités cliniques, les types de données, les modalités et les techniques d’LLM appliquées .
- Liang EN, Pei S, Staibano P, van der Woerd B. Clinical applications of large language models in medicine and surgery: A scoping review. : Cette revue de portée offre un aperçu complet de l’utilisation actuelle des LLM en médecine clinique et en chirurgie, incluant leurs caractéristiques, applications et état de préparation .
Méthodologies d’Optimisation et d’Ingénierie des Prompts
- Jeon S, Kim H-G. A comparative evaluation of chain-of-thought-based prompt engineering techniques for medical question answering. : Cette étude évalue les techniques d’ingénierie des prompts basées sur le « raisonnement en chaîne » pour les questions-réponses médicales à l’aide des LLM sur divers ensembles de données cliniques .
- Li S, Zheng C, Wu J, Xu Q, Xu X, Wang H, et al. Verification is All You Need: Prompting Large Language Models for Zero-Shot Clinical Coding. : Cette recherche intègre des LLM avec des données EHR longitudinales structurées via un cadre de prompts pour des prédictions cliniques à zéro-shot, démontrant une performance supérieure sans données étiquetées.
- Wang Z, Wang H, Danek B, Li Y, Mack C, Arbuckle L, et al. A perspective for adapting generalist AI to specialized medical AI applications and their challenges. : Ce document propose un cadre pour adapter les IA généralistes aux applications médicales spécialisées, incluant des stratégies d’optimisation (prompts, fine-tuning) et d’ingénierie de systèmes (agents, chaînes d’IA) .
Évaluation des Performances et des Biais des LLM
- Avnat E, Levy M, Herstain D, Yanko E, Ben Joya D, Tzuchman Katz M, et al. Performance of Large Language Models in Numerical Versus Semantic Medical Knowledge: Cross-Sectional Benchmarking Study on Evidence-Based Questions and Answers. : Cette étude évalue la performance des LLM (ChatGPT-4 et Claude3-Opus) sur des questions médicales numériques et sémantiques, les comparant aux experts humains et constatant une meilleure performance sur le sémantique .
- Fajkis-Zajączkowska N, Zawada A, Bojko M, Kolasa K. Comprehensive analysis of frameworks for evaluating artificial intelligence solutions in Healthcare: A descriptive review. : Cette étude analyse les cadres existants pour l’évaluation des solutions d’IA en santé, regroupant les critères en cinq domaines clés : clinique, économique, éthique, sécurité et convivialité.
- Naliyatthaliyazchayil P, Muthyala R, Gichoya JW, Purkayastha S. Evaluating the Reasoning Capabilities of Large Language Models for Medical Coding and Hospital Readmission Risk Stratification: Zero-Shot Prompting Approach. : Cette étude évalue des LLM de pointe (ChatGPT-4, LLaMA-3.1, Gemini-1.5, DeepSeek-R1, OpenAI-O3) sur des tâches de santé spécifiques comme le diagnostic principal et la prédiction du risque de réadmission à partir de notes cliniques.
- Lu H, Lin Y, Li Z, Yiu ML, Gao Y, Uddin S. Toward fair medical advice: Addressing and mitigating bias in large language model-based healthcare applications. : Cette étude se concentre sur l’abordage et l’atténuation des biais dans les applications de santé basées sur les LLM qui fournissent des conseils médicaux.
- Templin T, Fort S, Padmanabham P, Seshadri P, Rimal R, Oliva J, et al. Framework for bias evaluation in large language models in healthcare settings. : Ce document propose un cadre en cinq étapes pour évaluer rigoureusement les biais dans le diagnostic assisté par IA et autres décisions médicales, impliquant les parties prenantes et une surveillance continue .
- Laurito W, Davis B, Grietzer P, Gavenčiak T, Böhm A, Kulveit J. AI-AI bias: Large language models favor communications generated by large language models. : Cette étude révèle un biais des grands modèles linguistiques (LLM) qui tendent à favoriser les communications générées par d’autres LLM, un phénomène appelé « biais IA-IA ».
LLM et Gestion de la Littérature Scientifique (Revues Systématiques, Rédaction)
- Homiar A, Thomas J, Ostinelli EG, Kennett J, Friedrich C, Cuijpers P, et al. Development and evaluation of prompts for a large language model to screen titles and abstracts in a living systematic review. : Cette recherche évalue l’efficacité des LLM (GPT-4o) pour le criblage de titres et résumés dans les revues systématiques, visant à réduire la charge de travail des évaluateurs humains via l’ingénierie des prompts.
- Kobak D, González-Márquez R, Horvát E-Á, Lause J. Delving into LLM-assisted writing in biomedical publications through excess vocabulary. : Cette étude utilise l’analyse de l’excès de vocabulaire dans les résumés PubMed pour estimer l’utilisation généralisée des LLM dans la rédaction scientifique biomédicale, atteignant au moins 13,5% en 2024 .
- Moons P, Dou B, Desmedt C. Google’s AI co-scientist and OpenAI’s deep research: new partners in health research? : Ce document aborde les limites des systèmes d’IA multi-agents pour le traitement de la littérature scientifique (notamment les revues systématiques) et présente d’autres outils d’IA pour la synthèse littéraire et l’analyse de données .
- Rokhshad R, Bagherianlemraski M, Ehsani SS, Haghighat S, Schwendicke F. Large language models for the screening step in systematic reviews in dentistry. : Cette étude évalue la performance des chatbots LLM pour le criblage d’articles dans les revues systématiques en dentisterie, soulignant leur potentiel pour l’efficacité et la réduction de la charge de travail .
Gouvernance, Éthique et Intégration des LLM en Santé
- Davis HA, Kerkman D, Hoberg AA, Countryman M, Beaver W, Bybee K, et al. Establishing data governance for sharing and access to real-world data: a case study. : Ce document décrit l’évolution d’un processus de gouvernance des données pour le partage de données cliniques à des fins de recherche, abordant les étapes clés et les considérations pour les technologies d’IA émergentes .
- Jia J, Nishi H. A flexible two-stage anonymization framework for narrative medical records adapting to various language models. : Ce document propose un cadre d’anonymisation en deux étapes pour les dossiers médicaux narratifs, évaluant l’efficacité des modèles BERT et des LLM pour la détection d’entités et l’anonymisation .
- Li H, Fu J-F, Python A. Implementing Large Language Models in Health Care: Clinician-Focused Review With Interactive Guideline. : Cette revue propose un guide systématique pour les cliniciens afin de sélectionner des LLM adaptés à leurs tâches, en examinant leurs applications et défis dans un flux de travail clinique en 5 étapes .
- Moëll B, Sand Aronsson F. Harm Reduction Strategies for Thoughtful Use of Large Language Models in the Medical Domain: Perspectives for Patients and Clinicians. : Ce document détaille des cas d’usage judicieux et potentiellement problématiques des LLM pour les cliniciens et les patients, en mettant l’accent sur la réduction des risques et les stratégies d’intégration responsable.
- Luo X, Wang B, Shi Q, Wang Z, Lai H, Liu H, et al. Lack of Methodological Rigor and Limited Coverage of Generative AI in Existing AI Reporting Guidelines: A Scoping Review. : Cette revue de portée cartographie les lignes directrices de rapportage de l’IA en médecine, évaluant leur applicabilité aux outils d’IA générative comme les LLM et identifiant les lacunes méthodologiques.
- Sundar KR. When Patients Arrive With Answers. : Cet article discute de la situation où les patients arrivent avec des « réponses » (probablement générées par l’IA), soulevant des questions pour la pratique clinique.
LLM dans des Domaines Spécialisés (Bioinformatique, Éducation Médicale)
- Elvas LB, Almeida A, Ferreira JC. Natural language processing in medical text processing: A scoping literature review. : Cette revue de portée explore l’état de l’art des approches de traitement du langage naturel pour les textes médicaux, avec un accent sur la reconnaissance d’entités nommées basée sur les transformateurs dans des contextes multilingues.
- Keykha A, Fazlali B, Behravesh S, Farahmandpour Z. Integrating Artificial Intelligence in Medical Education: A Meta-Synthesis of Potentials and Pitfalls of ChatGPT. : Cette source explore les défis majeurs de l’utilisation de ChatGPT dans l’éducation médicale, en se basant sur une approche d’analyse thématique des concepts clés .
- Lavigne E, Lopez A, Frandon J, Blaizot G, Gabellier L, Adham S, et al. AI-Standardized Clinical Examination Training on OSCE Performance. : Cette étude évalue l’impact d’une méthodologie d’examen clinique standardisée par IA (alimentée par GPT-4) sur la performance des étudiants en médecine aux examens cliniques objectifs structurés (OSCE).
- Lin A, Ye J, Qi C, Zhu L, Mou W, Gan W, et al. Bridging artificial intelligence and biological sciences: a comprehensive review of large language models in bioinformatics. : Cette revue complète examine le développement et les applications des LLM en bioinformatique, notamment pour la prédiction de structures, l’analyse d’omiques, la conception de médicaments et l’exploration de la littérature biomédicale.