ACLMay, 2021

自注意力网络能够处理有界的分层语言

TL;DR证明自注意力网络可以处理具有层次结构的正式语言,例如 Dyck_k,但被证明对于近似自然语言来说过于有限,因此提出了在有限深度内捕获自然语言有界层次结构的 Dyck_(k,D) 子集,并构建了相应的硬注意力网络和软注意力网络。实验表明在此子集上训练的自注意力网络具有很好的泛化能力。