ACR:自动队友检索基准
通过提出 COhort Representation lEarning (CORE) 框架,从患者之间的细粒度 cohort 信息出发,对 EHR 数据表示进行增强学习,以提高患者管理和干预策略在临床实践中的应用,为医疗方法注入集体信息以提高性能。
Apr, 2023
临床放射学报告中的错误更正方法研究,利用大型语言模型(LLMs)和检索增强生成(RAG)技术,通过内部和外部检索机制从报告和外部知识源中提取相关医学实体和关系,并引入三阶段推理过程,将任务分解成错误检测、定位和更正子任务,从而提高了系统的可解释性和性能,并通过由领域专家指导的对真实世界放射学报告进行真实错误损坏的基准数据集进行了评估,实验结果表明了所提方法的优势,通过内部和外部检索的结合显著提高了各种最先进的 LLMs 在错误检测、定位和更正方面的准确性,研究结果有助于为临床文档制定更健壮可靠的错误更正系统。
Jun, 2024
使用大型语言模型(Flan-T5 XXL)从非结构化电子健康记录(EHR)数据中检索和总结与特定查询相关的论据,较传统信息检索方法更受放射科医生欢迎,但面临 LLMs 产生虚构证据的挑战。然而,模型的信心可能指示 LLMs 是否存在虚构,为解决此问题提供了潜在方法。
Sep, 2023
通过利用电子病历审计日志,我们的工作在特定的临床背景和特定时间点上,将机器学习作为便签相关性的监督源进行概念化,以降低临床医生在记录过程中查找相关病史所需的努力。我们的评估集中在急诊部动态检索,这是一个具有独特信息检索和记录编写模式的高急症设置。我们展示了我们的方法在预测哪些便签将在个人记录会话中被阅读方面可以达到 0.963 的 AUC。此外,我们对数名临床医生进行了用户研究,发现我们的框架可以帮助临床医生更有效地检索相关信息。在这个要求高的环境中展示我们的框架和方法表现良好是一个有希望的概念验证,表明它们将适用于其他临床设置和数据模态(例如实验室、药物、影像)。
Aug, 2023
本文通过系统调查研究,评估了检索增强型大型语言模型在 5 个不同的生物医学任务(三元组抽取、链接预测、分类、问题回答和自然语言推理)中的影响,并在医学领域建立了四个不同的测试组,测试了三个代表性的大型语言模型与三个不同的检索器在 9 个数据集上的性能。
May, 2024
ARCoT 是一种专为提高大型语言模型 LLMs 在专业领域(如医学物理学)中的领域特定准确性而设计的框架,通过检索机制获取相关的领域特定信息,并采用回退和思维链提示技术来引导 LLM 的推理过程,确保更准确和上下文感知的回答。在医学物理学多项选择考试的基准测试中,我们的模型优于标准 LLMs 并报道了平均人类表现,实现了高达 90%的高分,改进了多达 68%。ARCoT 的通用性和模型不可知性使其能够轻松适应各个领域,展示了在专门领域中提高 LLMs 准确性和可靠性的重要潜力。
May, 2024
本文介绍了一种用于 ICD 编码的多阶段 “检索和重排序” 框架,通过混合离散检索方法和对比学习,在一个简化的标签空间中使模型能够更准确地预测,实验结果显示该方法在 MIMIC-III 基准测试上达到了最先进的性能水平。
May, 2024