通过干预解释潜空间

AAAIDec, 2021

Latent Space Explanation by Intervention

Itai Gat, Guy Lorberbom, Idan Schwartz, Tamir Hazan

TL;DR本研究通过使用干预机制，利用离散变分自编码器来转移预测类别，进而可视化任何隐藏层的编码信息和对应的被干预表示来揭示深度神经网络的隐含概念，并通过评估原始表示与被干预表示之间的差异来确定可改变类别的概念，从而提高模型的可解释性。我们在 CelebA 数据集上展示了我们方法的有效性，并展示了有偏差数据的各种可视化并提供不同的干预方法来揭示和更正偏见。

Abstract

The success of deep neural nets heavily relies on their ability to encode complex relations between their input and their output. While this property serves to fit the training data well, it also obscures the mechanism that drives prediction. This study aims to reveal hidden concepts b

deep neural nets intervention mechanism discrete variational autoencoders explanatory model interpretability

发现论文，激发创造

在潜在特征空间中通过学习图像示例实现黑匣子解释

通过在黑盒模型中采用对抗性自动编码器学习到的潜在特征空间，生成实例图像并学习决策树分类器的方法，从而对黑盒模型进行解释，并提供了更好的解释性能。

Jan, 2020

从希望到安全：通过在潜空间中强制执行正确的原因来纠正深度模型的偏见

通过减少模型对偏见的敏感性，我们提出了一种在概念层面上确保正确原因的新方法，通过梯度来建模偏见，通过选择稳健的方向来减少模型对偏见的影响，并在 ISIC、Bone Age、ImageNet 和 CelebA 数据集上使用 VGG、ResNet 和 EfficientNet 架构，在受控和实际环境中有效地减轻偏见。

Aug, 2023

通过自编码激活实现深度神经网络的因果学习和解释

通过构建深度神经网络中的因果模型并使用自动编码器提取关键概念作为变量，我们开发了一种解释神经网络输出预测的方法，并使用该因果模型识别和可视化对最终分类具有显着因果影响的特征。

Feb, 2018

通过潜在空间分解揭示独特的概念向量

该论文提出一种后期无监督方法，通过分解和聚类方法，自动发现深度学习模型中的概念向量，从而支持可解释性分析，可以成功鉴别与疏离数据有关的训练样本

Jul, 2023

复杂性的重要性：重新思考生成建模的潜空间

本研究探讨了生成建模中潜在空间选择的最优解以及其确定过程，并提出了一种新的距离度量方法和具体的训练策略来优化潜在空间的选择，进而提高生成效果。

Jul, 2023

探索潜在路径：用变分自编码器提高自动驾驶的可解释性

自动驾驶中引入了一种基于生物启发的神经回路策略模型，整合了变分自编码器，提供了一种直接从输入摄像头图像生成转向命令的解决方案，并通过自动潜在扰动工具提高了系统的可解释性。该研究证明了变分自编码器 - 神经回路策略模型的解释能力，以及自动潜在扰动工具在提高自动驾驶系统内部工作透明度方面的实用性。

Apr, 2024

潜在卷积模型

本文提出了一种基于卷积流形的新型潜在模型用于大规模数据集的自然图像学习，该模型可用于多种图像修复任务，包括大空洞修补、超分辨率和上色等，相比于其他模型，本模型在一定范围内表现更为优异。

Jun, 2018

通过开关变量在隐含因果模型中实现解放

在没有已知基准图结构的情况下，从观察数据和干预数据中学习因果表示需要进行隐式潜在因果表示学习。本文通过软干预在变分自动编码器（VAE）框架中处理隐式潜在因果表示学习，提出了一种模拟软干预效果的方法，采用设计的因果机制切换变量在不同因果机制之间切换，实验证明相比基准方法，我们的方法能够稳定地改进可识别的因果表示的学习。

Feb, 2024

在神经网络内建模潜在注意力

本研究提出了一种可解释的方法，能够可视化神经网络中的内在机制和其对输出的影响，从而提高了深度神经网络的可解释性和决策过程，研究的主要贡献是提出了一种数据集中心的算法，适用于多个领域的深度神经网络结构。

Jun, 2017

通过稀疏因果干预分离潜在表示

通过将因果关系理论与矢量量化变分自编码器相结合，我们提出了一种新的基于因果动态的去纠缠方法，将量化向量视为因果变量并将其链接在因果图中，通过对因果图进行因果干预，引发影响图像中唯一变化因素的原子转换。同时，我们通过引入一个新的行动检索任务来测试我们的模型。我们在标准的合成和真实世界的去纠缠数据集上进行了测试，结果表明它能够有效地解缠图像变化因素并对图像的高级语义属性进行精确干预，而不影响其质量，即使在不均衡的数据分布下也是如此。

Feb, 2023