Jan, 2024

局部无关视频解释:基于移除的解释在视频中的适用性研究

TL;DR本文提出了一个针对视频领域的统一框架,旨在在维持高学习性能的同时,通过融合时序信息和实现局部解释,扩展针对计算机视觉数据的细粒度解释框架,并将六种现有的解释技术应用于视频数据,进行了评估和比较研究。研究结果表明,3D RISE、3D LIME和3D Kernel SHAP优于其他方法。通过将解释过程分解为可管理的步骤,我们便于研究每个选择的影响,并进一步改进解释方法以适应特定的数据集和模型。