EHRSHOT: 用于基础模型少样本评估的电子病历基准
通过将基础模型应用于医疗保健领域,可使人工智能的开发更具规模性和经济效益。医疗记录的结构化基础模型在数百万患者的记录上训练,表现出了较少训练标签的性能提升以及对分布变化的改进鲁棒性。本研究基于多中心数据研究探讨了这种基础模型的适应性,结果显示在医院间分享模型可提高预测性能并降低成本,进而强调基础模型作为模块化组件在健康保健人工智能开发中的实用性。
Nov, 2023
本文回顾了 80 多个非成像电子医疗记录基础模型并创建了一个分类法以区分它们的结构、训练数据和潜在用例。作者们发现,大多数模型是在小型、局限性临床数据集(例如 MIMIC-III)或广泛的公共生物医学语料库(例如 PubMed)上进行训练的,并且评估任务不能提供对其对医疗系统有用性的有意义见解。基于这些发现,作者提出了一个更加贴近医疗保健重要指标的评估框架,用于衡量临床基础模型的好处。
Mar, 2023
该研究提出了利用来自公开可用的激痛医学信息库(MIMIC-III)数据集的四个临床预测基准,旨在解决机器学习在医疗保健研究中缺乏公开可用基准数据集的问题。
Mar, 2017
针对结构化长期电子健康记录 (EHR) 数据与大型语言模型 (LLMs) 集成时的固有复杂性,本研究调查了像 GPT-4 这样的 LLMs 对 EHR 数据的适应性。特别关注其零样本能力,使其能够在并未明确训练的情况下进行预测。通过考虑特定的 EHR 特征 (如单位和参考范围),采用与临床环境相一致的上下文学习策略,我们的寻求方法能够应对 EHR 数据的纵向、稀疏和知识注入的特性。通过对 MIMIC-IV 和 TJH 数据集进行综合实验,证明了我们精心设计的提示框架下,LLMs 在关键任务 (如死亡率、住院天数和 30 天再入院率) 的预测性能可以提高约 35%,在少样本情景中超越了机器学习模型。我们的研究强调了 LLMs 在提高临床决策能力方面的潜力,尤其是在没有标签数据的紧急医疗情况下,如新发疾病的爆发。可通过此 https URL 获得代码,以便能重现研究结果。
Jan, 2024
使用电子健康记录进行循证医学和准确预测,通过 Fast Healthcare Interoperability Resources (FHIR) 格式表示病人的原始病历记录,并使用深度学习方法进行多中心的多个医疗事件预测,包括住院死亡率、未经计划的 30 天再入院率、医院停留时间延长、所有患者的最终出院诊断等。
Jan, 2018
使用大型语言模型,本研究探索将结构化的患者就诊数据(例如诊断、实验室和处方)转化为自然语言叙述的可行性,并提出了一种利用不同角色的语言模型代理(预测者代理和评论者代理)的新方法。结果表明,相比传统的监督学习方法,在基于电子健康记录的疾病预测中,使用该方法的大型语言模型能够实现相当不错的少样本性能,暗示其在健康相关应用中的潜力。
Mar, 2024
综合评估医疗机器学习的基准,提出一种基于医学信息志 (MIMIC-III) 的基准,让我们可以直接比较预测性能,并评估生存率、住院时间、表型和患者恶化任务的进展。我们发现,在这些任务上,尽管社区参与度高,但在过去的三年里,几乎没有真正显著的进展。通过我们的元分析,我们发现,深度递归模型的性能仅在某些任务上优于逻辑回归。最后综合这些结果,提出未来医学机器学习基准所需的理想特性。
Oct, 2020
深度学习在医学图像处理领域的应用受到数据不足的限制,因此研究者们开发出了一种称为 “Few-shot learning” 的模型,通过分类和分割方法来从小规模数据集中提取特征以解决数据不足的问题。本文综述了 Few-shot learning 的背景和基本概述,介绍了医学图像分析中的方法学策略比较,描述了 Few-shot learning 在医学图像处理应用的最新进展,并展望了其未来的应用前景。
May, 2023
本篇论文通过 MIMIC-III 数据集进行临床预测任务(如死亡率预测、住院时间预测以及 ICD-9 编码分组预测)的基准测试,结果表明,相较于基于机器学习模型和预测评分系统,深度学习模型在使用原始临床时间序列数据作为输入特征时有更好的表现。
Oct, 2017
通过引入 EHRMamba 和多任务提示微调(MTF)方法,此研究提出了一种基于 Mamba 架构的稳健基础模型,该模型具有较低的计算成本和较长的上下文长度,并且能够同时学习多个临床任务,从而在电子健康记录领域取得了重大突破。
May, 2024