ACLAug, 2021

拼字比赛中的模型:语言模型隐式学习到了单词字符组成

TL;DR通过分析预训练语言模型的嵌入层,研究表明该模型对于整词和子词令牌的内部字符构成也有很高的学习能力。虽然该模型没有直接使用字符信息,但它仍然能够拼写正确达到整体词汇量的三分之一,并在所有令牌类型上达到了高平均字符模型重叠度。而且,通过额外的字符信息来丰富子词模型的训练并不能提高其在语言建模上的性能。总体来说,该研究表明语言建模目标会激励模型隐式地学习拼写知识,而显式地教授拼写知识并不能提高其性能。