May, 2021

Poolingformer: 带池化注意力的长文档建模

TL;DR本文介绍了一种二级注意力模式,Poolingformer,用于长文档建模,其第一级使用较小的滑动窗口模式来聚合周围信息,第二级使用更大的窗口来增加接受场并使用池化注意力来减少计算成本和内存消耗。实验结果表明,Poolingformer在三个基准测试中领先于现有的最先进模型,在长序列QA任务和长序列摘要任务上表现出优异性能。