AAAINov, 2022

理解和增强基于概念模型的鲁棒性

TL;DR本研究旨在研究基于概念模型的鲁棒性和输出一致性的表现,提出并分析了不同的恶意攻击方式,并提出了基于对抗训练的防御机制,探讨了它们对模型在系统性扰动下的鲁棒性,发现所提出的防御方法可以提高概念模型的鲁棒性。