ICMLMay, 2019

通过内省检测神经网络中的对抗样本和其他分类错误

TL;DR通过在预训练的神经网络的 logits 上再训练一个简单的 3 层神经网络,我们能够竞争性地检测出分类错误,从而解决现代神经网络无法提供可靠置信值的问题(也就是所谓的敌对样本问题和过度自信问题)的局限性。