Mar, 2025

探究网络决策:在没有标签信息的情况下捕捉不确定性和揭示脆弱性

TL;DR本研究解决了深度神经分类器(DNN)决策可解释性不足的问题。我们提出了一种新颖的框架,通过反事实示例来揭示分类器的弱点,并介绍了一个探测器用以验证分类器的决策正确性。实验表明,该框架能够有效识别目标分类器的脆弱性,而无需依赖标签信息。