学会接受帮助：干预感知的概念嵌入模型

Sep, 2023

学会接受帮助：干预感知的概念嵌入模型

Learning to Receive Help: Intervention-Aware Concept Embedding Models

Mateo Espinosa Zarlenga, Katherine M. Collins, Krishnamurthy Dvijotham, Adrian Weller, Zohreh Shams...

TL;DR通过构建和解释高层概念的预测，概念瓶颈模型（CBMs）解决了神经架构的不透明性。我们提出了一种新的 CBM 基于架构和训练范式的模型，称为 Intervention-aware Concept Embedding models（IntCEMs），通过在训练时学习概念干预策略，有效地选择和接受概念干预，从而在测试时显著提高性能。我们的实验证明，当提供测试时概念干预时，IntCEMs 明显优于最先进的概念可解释模型，验证了我们方法的有效性。

Abstract

concept bottleneck models (CBMs) tackle the opacity of neural architectures by constructing and explaining their predictions using a set of high-level concepts. A special property of these models is that they per

concept bottleneck models opacity of neural architectures concept interventions intervention-aware concept embedding models test-time concept interventions

发现论文，激发创造

通过概念重新对齐提高概念瓶颈模型中的干预效果

该研究论文通过引入可训练的概念干预调整模块，利用概念关系重定位干预后的概念分配，从而显著提高干预效果，并且能够降低人机协作成本。

May, 2024

学习干预概念瓶颈

传统的深度学习模型缺乏解释性，概念瓶颈模型（CBMs）通过其概念表示提供内在解释。本文提出了概念瓶颈记忆模型（CB2M），通过两重记忆，CB2M 能够在新情境中学习推广干预，纠正模型的预测结果，从而自动改进模型性能。实验结果表明 CB2M 可以成功地推广到未见数据并识别错误的概念，是用户提供 CBM 互动反馈的一种有效工具。

Aug, 2023

证据概念嵌入模型：面向皮肤疾病诊断的可靠概念解释

由于医疗决策的重要性，对于医学图像分析中的可解释深度学习方法有着强烈的需求。本文提出了一种基于证据学习的概念嵌入模型 (ev-CEM)，用于建模概念的不确定性，并利用其来纠正在没有完全概念监督下使用视觉 - 语言模型训练概念瓶颈模型时出现的概念错位。通过使用所提出的方法，我们可以增强监督和高效标签设置下的概念解释的可靠性。此外，我们还引入了概念的不确定性以实现有效的测试时干预。我们的评估结果表明，ev-CEM 在概念预测方面具有出色的性能，并且所提出的概念纠正方法有效地减少了高效标签训练中的概念错位。我们的代码可在此 https URL 获取。

Jun, 2024

交互式概念瓶颈模型

该研究提出一种交互式的 CBMs 模型，通过在预测过程中询问人类协作者对于某些概念的标签来提升最终预测准确率，并通过性能比较证明该模型相较于其他方法更为优越。

Dec, 2022

理解和增强基于概念模型的鲁棒性

本研究旨在研究基于概念模型的鲁棒性和输出一致性的表现，提出并分析了不同的恶意攻击方式，并提出了基于对抗训练的防御机制，探讨了它们对模型在系统性扰动下的鲁棒性，发现所提出的防御方法可以提高概念模型的鲁棒性。

Nov, 2022

超越概念瓶颈模型：如何使黑箱可干预？

介绍了一种在已经训练好但不可解释的神经网络上进行基于概念的干预的方法，并将模型的可干预性定义为评估基于概念的干预效果的度量，通过对模型进行微调来改进干预效果并提高预测的校准性。实验结果表明，精调黑盒模型能够在干预效果上与概念瓶颈模型相媲美且更高性能。

Jan, 2024

随机概念瓶颈模型

通过建模概念间的依赖关系并引入分布参数化，提出了一种基于概念瓶颈模型的新方法，通过影响相关概念来提高干预效果，并展示了其在合成表格和自然图像数据集上显著提高干预效果的经验证据，同时还通过对 CLIP 推导的概念进行检验来展示 SCBMs 的多功能性和可用性，减少了人工概念注释的需求。

Jun, 2024

自动概念嵌入模型 (ACEM): 无需训练时间概念，无问题！

神经网络的可解释性和解释能力在特别是在安全关键领域和提供社会解释权方面不断增加。定概念解释在线合人类推理的方式上效果良好，是一种很好的解释模型的方法。概念嵌入模型是一种基于概念的解释架构，已经证明在解释能力和性能之间取得了平衡。然而，它们存在一个关键限制 -- 需要为所有训练数据提供概念注释。针对这一问题，我们提出了自动概念嵌入模型（ACEMs），可以自动学习概念注释。

Sep, 2023

增量残差概念瓶颈模型

我们提出了递增残差概念瓶颈模型（Res-CBM），以解决概念完整性的挑战。通过优化向量来完成缺失的概念，并将不明确含义的补充向量转化为候选概念库中的潜在概念，以增强任何 CBM 的性能。实验结果表明，Res-CBM 在准确性和效率方面优于当前最先进的方法，并在多个数据集上实现了与黑盒模型相当的性能。

Apr, 2024

可编辑的概念瓶颈模型

通过使用数学严谨的闭合形式近似和影响力函数，我们提出了可编辑的概念瓶颈模型（ECBMs），以解决从头重新训练的困境，实现高效率的数据删除和插入操作，从而适应大规模应用中的数据处理需求。

May, 2024