Dec, 2022

非参数遮蔽语言建模

TL;DR本论文介绍了一种基于非参数分布的掩码语言模型,其以参考语料库中的所有短语作为分布依据,通过对比学习和批次近似方法进行高效训练,实现了对罕见词或短语的有效预测和处理,与其他参数化模型比较表明,该模型在 9 项封闭任务和 7 项开放任务中的表现表明了优越性。