Jan, 2024

借助具备检索增强功能的大型语言模型改进医学推理

TL;DR自主生物文档检索增强式生成(Self-BioRAG)是一种可靠的生物医学文本生成解释、检索特定领域文档,并进行自我反思的框架。通过使用84k个过滤后的生物医学指令集训练Self-BioRAG,它可以使用定制的反思标记评估其生成的解释。实验结果表明,Self-BioRAG在三个主要的医学问答基准数据集上实现了显著的性能增益,平均绝对改进率为7.2%,超过了参数大小为7B或更少的最先进的开放式基础模型。我们将数据和模型权重(7B和13B)发布出来,以增强生物医学和临床领域的能力。