Mar, 2023

神经语言模型中的拼写规则敏感性

TL;DR研究表明,大型神经语言模型在训练时,能够学习英式和美式拼写约定的长距离依赖关系,但是只有对于观察到的词汇项,而非具有英式 / 美式拼写模式的虚构单词。此外,研究还发现 T5 和 GPT2 模型在纠正训练数据偏差方面存在限制。