Apr, 2022

语法何时在神经语言模型性能中发挥作用?来自 Dropout 探针的证据

TL;DR语言模型中使用的语法信息可能存在多余编码,通过一种新的探针设计,可准确引导探针考虑嵌入中的所有语法信息,揭示语法在当前方法未能探测到的模型中的有效性,进而通过注入语法信息提高模型性能。