Jun, 2019

神经序列模型中自注意力的理论限制

TL;DR本文研究了自注意力在建模形式语言方面的计算能力,发现其在处理分层结构时存在强烈的理论限制,但在自然语言处理方面表现卓越。