Feb, 2025

EpMAN:用于推广到更长上下文的情节记忆注意力

TL;DR本研究针对大型语言模型(LLMs)在处理长上下文时的效率问题,提出了一种新的方法EpMAN,通过情节记忆模块对语义相关的上下文块进行整体关注。实验结果表明,使用EpMAN训练的LLM解码器在多项具有挑战性的长上下文回忆和问答基准测试中表现出更强的韧性和优越性。