Jun, 2023

LongCoder:面向代码自动补全的长距离预训练语言模型

TL;DR本文介绍了一种新的代码补全任务,提出了一种称为LongCoder的稀疏Transformer模型来解决这个任务。LongCoder采用滑动窗口机制进行自我注意,并引入了两种全局可访问的标记-桥接标记和内存标记-以提高性能和效率。实验结果表明,LongCoder在维护推理时的计算资源效率方面保持相当的效率,在代码完成任务中比先前的模型性能更优秀。