Mar, 2024

锻造伪造者:通过数据增强改进作者验证的尝试

TL;DR在作者验证的敌对设置中,通过与负面合成样本增强分类器训练集,以模仿感兴趣作者的风格,无论是通过隐藏写作风格还是模仿其他作者的风格,本文以三种不同的生成器架构(基于循环神经网络的一种,基于小规模转换器的一种,以及基于流行的 GPT 模型的一种)和两种训练策略(一种受标准语言模型启发,另一种受 Wasserstein 生成对抗网络启发)来分析这种增强方法在作者验证任务中对分类器预测的改进效果。然而,实验结果显示,尽管该方法在许多敌对设置下有效,但其效果在实际应用中过于不稳定。