知识增强的高效医疗问答与问题生成
本文提出一种嵌入医疗领域知识和启用 Few-shot Learning 的方法,以迎合需要广泛的领域专业知识和语义知识(如医疗保健)的领域的需求。利用一种简单但有效的检索方法,本文高效提取医学背景知识以引导 ChatGPT 的推理和寻答的逻辑。我们的知识增强模型在 CNMLE-2022 上取得了高分 70,且不仅能够通过 CNMLE 考试但是还超越了人类的平均分数(61),这证明了知识增强 ChatGPT 作为多功能医疗助手的潜力,能够以更易于使用和适应的方式分析现实世界的医学问题。
May, 2023
通过自然语言处理和多模态范式,ChatGPT 探索了医学诊断、治疗建议和其他医疗支持的问题回答的战略蓝图,在医学领域数据的逐渐整合下,这些技术加快了医学领域问题回答的进展,通过连接人类自然语言与医学领域知识或专家手动注释的空白,处理了医学环境下大规模、多样化、不平衡或无标签数据分析的场景,强调了在不同任务和数据集中的应用,并概述了当前的挑战和未来医学领域研究的机遇和创新。
Jan, 2024
本研究介绍了一种专门为临床场景设计和优化的语言模型 ——ClinicalGPT,通过整合大量临床实际数据、领域特定知识和多轮次对话信息,使其更好地处理多种临床任务,并通过医学知识问答、医学考试、患者咨询和医疗记录的诊断分析等全面评估框架证明其在这些任务中显著优于其他模型,突出了我们的方法在将大型语言模型应用于卫生保健这一关键领域的有效性。
Jun, 2023
研究了 GPT-3.5 在实际世界中具有强大推理能力和专业领域知识的应用能力,使用了多项提示方法(CoT、零和少量训练以及检索增强),并在医学考试和阅读理解领域取得了人类水平表现。
Jul, 2022
通过对 USMLE 和 MultiMedQA 基准数据集的全面评估,我们发现不需要专门的提示造型来激发 GPT-4,它的表现超过了 USMLE 的合格分数约 20 分,并表现优于早期的通用模型(GPT-3.5)以及专门针对医学知识进行细化调整的模型(Med-PaLM,Flan-PaLM540B 的提示调整版本)。
Mar, 2023
本研究通过比较一般性和专用于医学问答的精简语言模型的性能,旨在填补这方面的空白,并评估不同语言模型家族的性能,以探讨这些模型在医学问答领域的可靠性、比较性能和有效性,从而为不同语言模型在医学领域的特定应用提供有价值的见解。
Jan, 2024
近年来,大型语言模型(LLMs)在大文本语料库的预训练过程中展示了令人印象深刻的知识编码能力。本研究通过构建一个新的基于系统评述的数据集,评估了六种 LLMs(如 GPT 和 Mixtral)在医学知识回忆方面的能力,并揭示了此任务的复杂性。
Jun, 2024
使用 GPT-3 模型进行医疗问题回答(MedQA)存在挑战和风险,分析表明 LLMs 对高风险的查询无法适当回应,生成错误的医疗信息、不安全的建议和可能被视为冒犯的内容。
Aug, 2023
本文描述了一个架构,利用原始外部知识,基于无监督学习的技术,使得更小的模型可以回答与事实有关的问题,其目的在于能够显式地添加知识,而无需进行大量的训练。
Nov, 2019
在使用真实的大型电子病历数据库进行两项分析后,发现 ChatGPT 和 GPT-4 可以通过思路链和几次提示,准确地完成疾病分类任务,并为卫生保健工作者提供诊断辅助,但是这些模型目前存在错误陈述、忽视重要医学发现、推荐不必要的调查和过度治疗等问题,并伴随有隐私问题,因此仍不适用于现实世界的临床使用。不过,与传统机器学习工作流程的配置相比,这些模型所需的数据和时间较少,突出了它们在卫生保健应用中的可扩展性潜力。
Jul, 2023