ICMLMay, 2024

流形综合梯度:特征归因的黎曼几何

TL;DR通过适应路径影响力的方法,了解了集成梯度(IG)在黑盒深度学习模型中存在的可靠性问题,主要是生成针对视觉模型的嘈杂特征可视化和对敌对归属攻击的脆弱性。我们的实验使用深度生成模型应用于多个真实图像数据集,证明了 IG 沿测地线符合黎曼数据流形的曲线几何性质,生成更具感知直观性的解释,从而大大增加了针对归属攻击的鲁棒性。