ACLJun, 2024
位于中间:校准位置注意偏差以改进长上下文利用
Found in the Middle: Calibrating Positional Attention Bias Improves Long Context Utilization
Cheng-Yu Hsieh, Yung-Sung Chuang, Chun-Liang Li, Zifeng Wang, Long T. Le...
TL;DR长文本中,大语言模型存在失效过中间信息的问题,我们通过研究发现这一现象与其内在的注意力偏差有关,而通过中间定位机制可以解决这一问题,并在检索增强生成任务中表现出更好的性能。