ICLRMar, 2021

IOT: Transformer 结构的实例层重新排序

TL;DR本文发现每一个数据样本实际上喜欢不同的层序,为此将实例层次重排序引入了 Transformer 模型中以生成变体函数,最终通过多个实验验证表明,此算法可以显著提高语言建模的性能。