Aug, 2022

不同位置感知机制理解长文档

TL;DR本篇论文提出了一种新型基于 transformer 的 1D 和 2D 位置感知注意力机制,实验结果表明,该模型在进行长篇文档理解时具有优势,易于基于其他基于 transformer 的架构进行扩展。