Dec, 2022

语言生成模型的自然偏好

TL;DR本文提出了一种以 unigram 分布为先验知识的初始化模型权重的方法,在神经语言生成模型中应用该方法可提高学习效率、整体性能以及鼓励模型专注于非频率相关的语言特性。