ACLMar, 2022

演讲者信息可指引模型更好地应用归纳偏好:以代码交替预测为例的案例研究

TL;DR通过在受控的、受过教育的方式下丰富模型的说话人信息,可以指导模型捕捉相关的归纳偏差。在预测英语 - 西班牙双语对话中的代码切换点的任务中,加入基于社会语言学的说话者特征可以显著提高准确性。此外,我们发现通过将有影响力的短语添加到输入中,基于说话者的语言模型可以学习有用且可解释的语言信息。这是我们首次将说话人信息纳入神经模型进行代码切换,更进一步地,朝着开发使用受控方式的透明个性化模型迈出了一步。