Apr, 2022

用于推特健康提及分类的多种语言模型训练的新方法

TL;DR本文提出了一种新的方法,使用对抗训练和对几个级别的 transformer 模型中的推文示例的表示进行高斯噪声扰动生成对抗性示例来训练语言模型,以进行卫生提及分类。添加噪声到较早的层有助于提高模型性能,而添加中间层的噪声会降低模型性能。最后,在最终层添加噪声比在中间层添加噪声表现更好。