May, 2023

分段循环变压器:一种高效的序列到序列模型

TL;DR本研究提出一种名为 “SRformer” 的分段循环变压器模型,通过使用分段关注机制和循环关注机制结合来处理长度较长的序列,降低计算和内存成本,并应用于 T5 和 BART 转换器上进行摘要生成等任务,结果显示比分段变压器基线具有更高的性能表现。