ACLJun, 2024

位于中间:校准位置注意偏差以改进长上下文利用

TL;DR长文本中,大语言模型存在失效过中间信息的问题,我们通过研究发现这一现象与其内在的注意力偏差有关,而通过中间定位机制可以解决这一问题,并在检索增强生成任务中表现出更好的性能。