Feb, 2024

JMLR: 提升推理能力和专业问答能力的联合医疗语言模型和检索训练

TL;DR通过在细调阶段共同训练信息检索系统和大规模语言模型,引入了一种创新方法 —— 共同医学 LLM 和检索训练(JMLR),以克服传统模型在处理医学问答任务方面面临的挑战,通过采用同步训练机制,JMLR 降低了对计算资源的需求,增强了模型利用医学知识进行推理和回答问题的能力。我们的实验结果表明,JMLR-13B 在 Amboos 上的正确率为 81.2%,在 MedQA 上的正确率为 61.3%,优于使用传统预训练和精调 Meditron-70B 模型(在 AMBOSS 上为 76.4%,在 MedQA 上为 60.3%)。在规模相同的 7B 模型中,JMLR-7B 的正确率(在 Amboos 上为 68.7%,在 MedQA 上为 51.7%)明显优于其他公开模型(Meditron-7B:50.1%,47.9%),证明了它在成本(我们的训练时间:37 小时,传统方法:144 小时)、效率和医学问题回答任务的有效性方面的优越性。通过此工作,我们为医疗保健提供了一种新的高效知识增强工具,展示了将信息检索和大规模语言模型训练集成到精确医学信息检索和问答系统中的巨大潜力。