Oct, 2022

Transformer meets Stochastic Block Model: 数据自适应稀疏性和成本的注意力

TL;DR本研究提出了 SBM-Transformer 模型,利用基于混合成员资格随机块模型(SBM)的稀疏注意力来解决二次成本问题,并证明了 SBM-Transformer 是任意序列到序列函数的通用逼近器,同时在 LRA 和 GLUE 基准测试中表现出优异的性能。