利用大型语言模型扩展临床试验配对:一个肿瘤学案例研究
利用实际世界的电子健康记录,我们进行了第一次端到端的大规模实证评估,展示了大型语言模型在准确匹配患者和适当临床试验方面的能力。
Apr, 2024
研究使用大型语言模型(LLMs)协助患者和转诊医生从广泛的选择中筛选适合的临床试验,并评估了 TrialGPT 在 184 名患者和 18,238 个注释临床试验的实验结果,表明其高准确性和排名排除不合格候选试验的有效性。
Jul, 2023
探究专有和开源大型语言模型在患者试验匹配任务中的有效性,并证明在有限和合成数据集上进行微调后,开源模型与专有模型性能相当,从而为它们在实际医疗应用中的部署提供了巨大机会。
Dec, 2023
利用大型语言模型加速临床试验操作,设计了一个基于零 - shot 方法的系统来评估患者是否符合试验纳入标准,并通过优化数据和成本效率以及提高解释性来改进该方法。
Feb, 2024
本研究旨在探讨利用大型语言模型 (LLMs) 解决现有医学研究中患者与合适临床试验配对方面所面临的挑战,提出了一个基于 LLMs 的隐私感知数据增强方法,以实现对敏感患者数据的保护与有效的匹配。实验证明,此方法平均性能提高了 7.32%,新数据的通用性提高了 12.12%,并通过案例研究深入说明了其有效性与原理。
Mar, 2023
使用 InstructGPT 帮助医生根据患者的医疗概况确定临床试验的资格,通过组合一次性、选择推论和思考链技术,将 LLM 应用于 10 个合成患者概况,并有医生参与辅助判断,可实现 1.0 的召回率和 0.71 的精确率。
Apr, 2023
大型语言模型在临床应用中的关键性挑战是对其进行有效的对齐,以实现准确生成具备事实内容和非平凡推理能力的响应。本研究提出了一种名为 “扩展 - 猜测 - 精化” 的医学问题回答的对齐策略,该策略通过采用指令调整和少样本以及连续思考等方法显著提高了大型语言模型的性能。初步分析表明,该方法在从 USMLE 数据集中选取的问题子集上达到了 70.63% 的优异表现。
Sep, 2023
该研究提出了 CancerLLM 模型,该模型具有 70 亿个参数和 Mistral 风格的架构,预先训练了 2,676,642 份临床笔记和 515,524 份病理报告,涵盖了 17 种癌症类型,并在三个与癌症相关的任务上进行了微调,包括癌症表型提取、癌症诊断生成和癌症治疗计划生成。评估结果表明,CancerLLM 相对于其他现有的语言模型取得了最先进的结果,平均 F1 得分提高了 8.1%。此外,CancerLLM 在两个提出的鲁棒性测试中表现优于其他模型,这表明 CancerLLM 可以有效应用于临床 AI 系统,增强了癌症领域的临床研究和医疗服务。
Jun, 2024
使用 Langchain 提示工程流程,Fine-tune 基于临床数据和临床指南文本语料库的先进 OpenAI 模型,实现了对乳腺癌患者的辅助放疗和化疗的高准确率(0.85+)分类。通过从人类肿瘤学家的观察数据建立信心区间,估计模型必须在治疗预测中超过原始肿瘤学家的比例为 8.2%至 13.3%。尽管肿瘤治疗决策结果的不确定性,但未来研究,可能是临床试验,需要确定这一阈值是否被模型满足。然而,因为 85%的美国癌症患者在本地社区设施接受治疗,这些模型在扩大获取质量护理的同时,最小程度上接近人类肿瘤学家将发挥重要作用。
Jun, 2024
本研究通过对临床语言理解任务的全面评估和引入一种新的提示策略 —— 自问自答提示(SQP),来提高大型语言模型 (GPT-3.5、GPT-4 和 Bard) 在医疗相关任务中的性能,同时还提供了有关挑战性关系抽取任务误差分布和潜在改进方法的有价值洞察。此项研究为之后的研究和开发医疗应用奠定了基础。
Apr, 2023