关键词gradient-based explanations
搜索结果 - 4
- ICML鲁棒的排名解释
机器学习模型解释的鲁棒性对于建立人类对模型的信任至关重要,本研究提出了用于衡量显著特征排名稳定性的解释厚度,并通过设计 R2ET 算法以最大化厚度来保护易受攻击的梯度解释,实验证明 R2ET 在隐蔽攻击下具有更高的解释鲁棒性并保持准确性。
- 通过鼓励一致的基于梯度解释来改善视觉定位
Attention Mask Consistency 是一种基于边缘的损失函数,在视觉语言模型预训练中作用使得梯度基础的解释与区域级别注释保持一致,并且比依赖于明确训练对象检测器的区域级注释的模型产生更优秀的视觉定位性能。
- 文本分类可解释性技术的诊断研究
本文评估了不同的解释方法及其对神经网络和文本分类任务的影响,发现梯度基础的解释方法在不同任务及神经网络结构中表现最佳。
- 从模型解释中重建模型
该研究通过理论和实验表明,基于梯度的模型解释快速揭示模型本身,该结果强调了梯度而不是标签作为学习原语。同时,该研究提出了有效的启发式方法,以重新构建从梯度说明中获得的模型。