Apr, 2024

我们正在呼唤干预:对语言模型在不同类型语言变异中的适应性进行深入研究

TL;DR通过一系列干预和实验证明,我们可以理解语言模型对于存在语言变异(例如非标准或方言文本)的文本的适应性。在包括字符级、子词级和词级变化的语言变异方面进行干预,通过不同规模和性质的训练数据进行语言模型适应,我们对于语言变异对于语言模型的困难有了重要的认识。我们的发现对于方言自然语言处理和增强语言模型对语言变异的鲁棒性的未来研究有着重要的启示。我们公开提供了可以应用于任何英文文本数据的干预代码。