Feb, 2024

超越极限:大型语言模型中扩展上下文长度的技术综述

TL;DR本文调查了扩展序列长度的技术和方法,包括架构修改和注意机制的改变等多种方法,并讨论了当前方法的局限性和未来研究方向建议,强调了序列长度对大型语言模型进一步发展的重要性。