BriefGPT.xyz
Ask
alpha
关键词
perturbation-based
搜索结果 - 3
LIPEx -- 局部可解释性概率解释 -- 超越真实类别
本研究介绍了一种新型的基于扰动的多类别解释框架 LIPEx(局部可解释的概率解释),证明 LIPEx 不仅可以局部复制广泛使用的复杂分类模型输出的概率分布,而且还可以提供关于每个被认为重要的特征如何影响每个可能类别的预测概率的见解。研究通过
→
PDF
9 months ago
使用与模型无关方法生成详细显著性地图
本研究关注机器学习模型的解释方法,介绍了一种基于 RISE 的改进方法 VRISE,包括使用凸多边形覆盖替代了方形遮挡,并加入信息保证生成器来提高解释准确性和加速收敛速度。实验证明,使用 VRISE 产生的沙漏图更加精确并且不需要过多的计算
→
PDF
2 years ago
ICLR
利用范数界限对抗鲁棒性引起的过度不变性
本文演示了对扰动型对抗样本的稳健性不仅不足以实现普遍的稳健性,而且它还会增加模型对于不变性型对抗样本的脆弱性,并呼吁一组精确的定义来对学习中的这些限制进行分类和解决。
PDF
5 years ago
Prev
Next