Oct, 2022

为什么自注意力在序列到序列问题中是自然的?来自对称性的视角

TL;DR本文研究了 seq2seq 函数的正交等变性和嵌入空间中的自注意力结构对于序列到序列问题的作用,并发现其自注意力结构是表达目标函数的合适结构。