Oct, 2023

EMO: 自回归语言建模的地球移动距离优化

TL;DR神经语言模型是人类文本的概率模型,主要使用最大似然估计进行训练。本文提出了基于 EMD 优化的自回归语言建模方法,通过对 EMD 的上界估计实现了端到端训练,并在广泛评估中表现出了比 MLE 更好的语言建模性能。此外,EMO 还能在仅微调 25000 个句子的情况下大幅提升下游任务性能,展现了作为轻量级校准方法的巨大潜力。