May, 2023

Unlimiformer: 具有无限长度输入的长程 Transformer

TL;DR这篇论文提出了一种名为 Unlimiformer 的新方法,可以在不需要修改模型代码或增加学习的权重的情况下,将具有谷歌的长文本模型 Longformer 和 Facebook 的 BART 等预训练模型拓展到可输入无限长度的输入序列,并在多篇文档摘要任务上表现出很高的效果。