ICLRMar, 2021
IOT: Transformer 结构的实例层重新排序
IOT: Instance-wise Layer Reordering for Transformer Structures
Jinhua Zhu, Lijun Wu, Yingce Xia, Shufang Xie, Tao Qin...
TL;DR本文发现每一个数据样本实际上喜欢不同的层序,为此将实例层次重排序引入了 Transformer 模型中以生成变体函数,最终通过多个实验验证表明,此算法可以显著提高语言建模的性能。