Apr, 2022

自动后编辑半监督学习:通过填充带有错误标记的掩码合成数据

TL;DR通过使用掩码语言模型来创建包含错误标记的文本的噪声数据合成方法,以及利用受益样本的语料库交错的方法,可以提高半监督学习在自动编辑中的性能。