Nov, 2023

在长上下文大语言模型中推进 Transformer 架构的综合调查

TL;DR该研究论文主要针对基于 Transformer 的大型语言模型的长上下文能力进行了模型架构的改进,并提供了与之相关的评估需求以及未来研究的挑战和潜在方向。