May, 2023

DADA: 动态聚合语言规则实现方言适应性

TL;DR提出了一种叫做 DADA 的模块化方法,通过将处理特定语言特征的适配器组合在一起,赋予了 SAE 训练模型多方言鲁棒性。 DADA 的组合架构允许针对特定的方言变体进行定向适应,同时适应多种方言。 通过实验证明,DADA 适用于单一任务和指令微调语言模型,为将现有的 LLMs 适应不同英语方言提供了一个可扩展和可解释的框架。