Oct, 2022

预训练的转换器并不总是能提高健壮性

TL;DR对 10 种模型进行对比研究,发现在加入噪声数据的情况下,预训练 Transformer 模型比传统模型提供了更少的鲁棒性,在使用对抗过滤方法进行扩展后,虽然增加了泛化性,但在面对噪声数据时依然无法提供足够的鲁棒性。