Mar, 2021
OmniNet: 基于 Transformer 的全向表示
OmniNet: Omnidirectional Representations from Transformers
Yi Tay, Mostafa Dehghani, Vamsi Aribandi, Jai Gupta, Philip Pham...
TL;DR本文提出了一种名为 Omninet 的模型,通过利用元学习来学习全方位的自注意力机制,并使用高效的自注意力模型(如基于核的、低秩的和大型鸟)以缓解其高计算成本,经过在多项任务上的广泛实验,证明了这个模型在语言建模和图像识别方面已经取得了非常优秀的表现。