Nov, 2023

中间不再迷失:通过增强注意力来提升大型语言模型在问答任务中的表现

TL;DR通过 Attention Strengthening Multi-doc QA 任务,本文提出了一种增强长文本上大语言模型(LLMs)信息搜索以及反思能力的方法,实验证明在 Multi-doc QA 和其他基准测试中相比最先进模型,我们的模型在乱序设置下取得了 13.7%绝对增益,以及在段落检索任务中取得了 21.5%的改进。我们将我们的模型 Ziya-Reader 发布出来,以促进相关研究在社区中的开展。