XAI4LLM。让机器学习模型和 LLM 合作,提升医疗领域的上下文学习
通过综述大型语言模型在医学领域中的应用和意义,揭示了它们在知识检索、研究支持、临床工作流自动化和诊断辅助等方面的效用,并探索了多模态语言模型以及自动化代理在医疗保健中的发展潜力。然而,为了有效地将这些模型整合到临床实践中,需要不断优化和进行伦理监管。
Nov, 2023
论文探讨了临床医师对 LLMs 的信任与数据来源从人生成为 AI 生成内容的演变关系,并随之对 LLMs 的准确性和临床医师能力的影响。关注的其中一个主要问题是随着 LLMs 对其输出越来越依赖于学习,可能导致输出质量的降低和临床医师技能的减弱,因为与基本诊断过程的接触减少。虽然目前处于理论阶段,但这种反馈循环对于深入整合 LLMs 于医疗保健领域提出了重大挑战,强调了积极对话和战略措施以确保 LLM 技术的安全有效使用的必要性。此外,我们深入探讨了 LLMs 自我参考学习循环和医疗保健专业人员能力下降的潜在风险。LLMs 在回音室内运行的风险,其中 AI 生成的内容反馈到学习算法中,威胁到数据池的多样性和质量,可能固化偏见并降低 LLMs 的效力。同时,对 LLMs 在常规或关键任务方面的依赖可能导致医疗保健提供者的诊断和思考能力下降,特别影响未来专业人员的培训和发展。
Mar, 2024
数字卫生工具与大型语言模型(LLMs)结合可在临床环境中提供新颖的接口,增强数字医疗工具的实用性和实际影响,解决了使用 LLMs 时出现的问题,如幻觉,从而提高心血管疾病和糖尿病风险预测的效果。
Oct, 2023
使用大型语言模型,本研究探索将结构化的患者就诊数据(例如诊断、实验室和处方)转化为自然语言叙述的可行性,并提出了一种利用不同角色的语言模型代理(预测者代理和评论者代理)的新方法。结果表明,相比传统的监督学习方法,在基于电子健康记录的疾病预测中,使用该方法的大型语言模型能够实现相当不错的少样本性能,暗示其在健康相关应用中的潜力。
Mar, 2024
将人工智能(AI)与临床诊断过程中的大型语言模型(LLMs)整合,可以显著提高医疗保健的效率和可访问性。本研究通过引入 CliBench—— 一个基于 MIMIC IV 数据集的新型基准测试,评估 LLMs 在临床诊断中的能力,覆盖了多种临床病例的诊断,并包括与临床有关的任务,如治疗程序识别、实验室检查和药物处方等。通过结构化输出本体,CliBench 能够深入了解 LLMs 在不同临床任务上的能力,从而为 LLM 在医疗保健领域的未来发展提供有价值的见解。
Jun, 2024
大型语言模型在临床应用中的关键性挑战是对其进行有效的对齐,以实现准确生成具备事实内容和非平凡推理能力的响应。本研究提出了一种名为 “扩展 - 猜测 - 精化” 的医学问题回答的对齐策略,该策略通过采用指令调整和少样本以及连续思考等方法显著提高了大型语言模型的性能。初步分析表明,该方法在从 USMLE 数据集中选取的问题子集上达到了 70.63% 的优异表现。
Sep, 2023
该研究展示大型语言模型能够通过只有少量的微调,在医疗和健康领域中处理不易表达为文本的各种生理和行为时间序列数据,并对心脏信号分析、身体活动识别、代谢计算和压力报告估计等健康任务进行有意义的推理。
May, 2023
大型语言模型在医疗领域的利用引发了劲头和担忧,本文概述了目前开发的大型语言模型在医疗保健方面的能力,并阐明它们的发展过程,旨在提供从传统预训练语言模型(PLMs)到大型语言模型(LLMs)的发展路线图的概览。总的来说,我们认为正在进行一次重大的范式转变,从 PLMs 过渡到 LLMs,这包括从辨别式人工智能方法向生成式人工智能方法的转变,以及从以模型为中心的方法论向以数据为中心的方法论的转变。
Oct, 2023
提出了一种基于大型语言模型(LLMs)的多学科协作(MC)框架,通过角色扮演的 LLM 代理参与协作多轮讨论,增强 LLM 的能力和推理能力,用于挖掘并利用 LLMs 中的医学专业知识和扩展其推理能力,同时在人类评估中找出常见错误并进行消融研究。
Nov, 2023