超越概念瓶颈模型：如何使黑箱可干预？

Jan, 2024

超越概念瓶颈模型：如何使黑箱可干预？

Beyond Concept Bottleneck Models: How to Make Black Boxes Intervenable?

Ričards Marcinkevičs, Sonia Laguna, Moritz Vandenhirtz, Julia E. Vogt

TL;DR介绍了一种在已经训练好但不可解释的神经网络上进行基于概念的干预的方法，并将模型的可干预性定义为评估基于概念的干预效果的度量，通过对模型进行微调来改进干预效果并提高预测的校准性。实验结果表明，精调黑盒模型能够在干预效果上与概念瓶颈模型相媲美且更高性能。

Abstract

Recently, interpretable machine learning has re-explored concept bottleneck models (CBM), comprising step-by-step prediction of the high-level concepts from the raw features and the target variable from the predicted concepts. A compelling advantage of this model class is the user's ab

interpretable machine learning concept bottleneck models concept-based interventions fine-tuning black-box models intervenability

发现论文，激发创造

学习干预概念瓶颈

传统的深度学习模型缺乏解释性，概念瓶颈模型（CBMs）通过其概念表示提供内在解释。本文提出了概念瓶颈记忆模型（CB2M），通过两重记忆，CB2M 能够在新情境中学习推广干预，纠正模型的预测结果，从而自动改进模型性能。实验结果表明 CB2M 可以成功地推广到未见数据并识别错误的概念，是用户提供 CBM 互动反馈的一种有效工具。

Aug, 2023

通过概念重新对齐提高概念瓶颈模型中的干预效果

该研究论文通过引入可训练的概念干预调整模块，利用概念关系重定位干预后的概念分配，从而显著提高干预效果，并且能够降低人机协作成本。

May, 2024

随机概念瓶颈模型

通过建模概念间的依赖关系并引入分布参数化，提出了一种基于概念瓶颈模型的新方法，通过影响相关概念来提高干预效果，并展示了其在合成表格和自然图像数据集上显著提高干预效果的经验证据，同时还通过对 CLIP 推导的概念进行检验来展示 SCBMs 的多功能性和可用性，减少了人工概念注释的需求。

Jun, 2024

交互式概念瓶颈模型

该研究提出一种交互式的 CBMs 模型，通过在预测过程中询问人类协作者对于某些概念的标签来提升最终预测准确率，并通过性能比较证明该模型相较于其他方法更为优越。

Dec, 2022

事后概念瓶颈模型

本研究介绍后续概念瓶颈模型（PCBM），它可以将任何神经网络转换为具有解释性的概念瓶颈模型，无需在训练数据中密集注释概念，同时保持模型性能和解释性优势。PCBM 还可以从其他数据集或自然语言描述中通过多模式模型转移概念，从而实现全局模型编辑。通过用户研究表明，通过概念层反馈编辑 PCBM 可以在不使用目标域或模型重新训练的数据的情况下，显著提高性能。

May, 2022

学会接受帮助：干预感知的概念嵌入模型

通过构建和解释高层概念的预测，概念瓶颈模型（CBMs）解决了神经架构的不透明性。我们提出了一种新的 CBM 基于架构和训练范式的模型，称为 Intervention-aware Concept Embedding models（IntCEMs），通过在训练时学习概念干预策略，有效地选择和接受概念干预，从而在测试时显著提高性能。我们的实验证明，当提供测试时概念干预时，IntCEMs 明显优于最先进的概念可解释模型，验证了我们方法的有效性。

Sep, 2023

我们能约束概念瓶颈模型学习语义有意义的输入特征吗？

概念瓶颈模型是一种具有内在可解释性的模型，本文研究了如何通过细粒度概念注释的数据集学习概念，并通过移除问题概念相关性来实现概念与输入特征之间的语义映射，通过引入基于纸牌领域的合成图像数据集作为未来研究的基准，以及在胸部 X 光数据集上的实证研究来验证概念在实际应用中的可学习性。

Feb, 2024

增量残差概念瓶颈模型

我们提出了递增残差概念瓶颈模型（Res-CBM），以解决概念完整性的挑战。通过优化向量来完成缺失的概念，并将不明确含义的补充向量转化为候选概念库中的潜在概念，以增强任何 CBM 的性能。实验结果表明，Res-CBM 在准确性和效率方面优于当前最先进的方法，并在多个数据集上实现了与黑盒模型相当的性能。

Apr, 2024

概念瓶颈模型的可解释预测

通过提出基于概念解释的概念瓶颈模型（CBMs）来预测剩余寿命，改进了深度学习在工业资产预测中缺乏解释性的问题，并展示了 CBMs 在剩余寿命预测中的性能优势和可解释性。

May, 2024

概率性概念瓶颈模型

本研究中，我们提出了一种基于概率概念瓶颈模型（Probabilistic Concept Bottleneck Models，ProbCBM）的解释性模型，它可以通过建模概念预测的不确定性来提高可靠性和解释性。我们的方法不仅可以提供高水平的概念推导，还可以推断类不确定性。

Jun, 2023