Feb, 2024

极端误校准与对抗鲁棒性的错觉

TL;DR深度学习自然语言处理(NLP)模型容易受到对抗性攻击,而测试时的温度缩放可提高真正的鲁棒性。