ACLMay, 2021

一种用于语言建模的认知正则化器

TL;DR使用正则化编码的 UID 假设可以作为一种归纳偏差,用于训练语言模型,这在十种涵盖了五种语言家族的语言模型实验中体现出来,使用 UID 正则化一致地提高了语言模型的困惑度,特别是在数据量有限的情况下。此外,我们发现,UID 正则化的语言模型生成的文本具有更多的词汇多样性。