基于概念残差模型的分解性能测评和增强

Nov, 2023

基于概念残差模型的分解性能测评和增强

Benchmarking and Enhancing Disentanglement in Concept-Residual Models

Renos Zabounidis, Ini Oguntola, Konghao Zhao, Joseph Campbell, Simon Stepputtis...

TL;DR通过对概念和残差进行分离的三种新方法来减轻信息泄露，研究和平衡模型性能和可解释性之间的关键平衡，以及如何干预概念对任务性能的影响。

Abstract

concept bottleneck models (CBMs) are interpretable models that first predict a set of semantically meaningful features, i.e., concepts, from observations that are subsequently used to condition a downstream task.

concept bottleneck models semantically meaningful features information leakage disentangling concepts model performance

发现论文，激发创造

增量残差概念瓶颈模型

我们提出了递增残差概念瓶颈模型（Res-CBM），以解决概念完整性的挑战。通过优化向量来完成缺失的概念，并将不明确含义的补充向量转化为候选概念库中的潜在概念，以增强任何 CBM 的性能。实验结果表明，Res-CBM 在准确性和效率方面优于当前最先进的方法，并在多个数据集上实现了与黑盒模型相当的性能。

Apr, 2024

具有额外无监督概念的概念瓶颈模型

本文提出了一种基于概念瓶颈模型的新型可解释模型，集成了监督和无监督概念，减少了计算量，同时取得了比 CBM 和 SENN 更优异的实验效果，并可视化每个概念的显著性图，符合语义意义。

Feb, 2022

使用监督、层次概念学习消除硬概念瓶颈模型中的信息泄漏

提供标签监督和层次化概念集概念预测模式，SupCBM 消除信息泄漏问题，实现准确预测和解释。

Feb, 2024

概念瓶颈模型的可解释预测

通过提出基于概念解释的概念瓶颈模型（CBMs）来预测剩余寿命，改进了深度学习在工业资产预测中缺乏解释性的问题，并展示了 CBMs 在剩余寿命预测中的性能优势和可解释性。

May, 2024

我们能约束概念瓶颈模型学习语义有意义的输入特征吗？

概念瓶颈模型是一种具有内在可解释性的模型，本文研究了如何通过细粒度概念注释的数据集学习概念，并通过移除问题概念相关性来实现概念与输入特征之间的语义映射，通过引入基于纸牌领域的合成图像数据集作为未来研究的基准，以及在胸部 X 光数据集上的实证研究来验证概念在实际应用中的可学习性。

Feb, 2024

通过概念重新对齐提高概念瓶颈模型中的干预效果

该研究论文通过引入可训练的概念干预调整模块，利用概念关系重定位干预后的概念分配，从而显著提高干预效果，并且能够降低人机协作成本。

May, 2024

关于概念瓶颈模型中的概念可信度

在这项研究中，我们建立了一个评估概念的可信度的基准，提出了一种概念可信度评分指标，并引入了增强的 Concept Bottleneck Models（CBMs），通过 CLA、CIA 和 PA 模块进一步提高 CBMs 的概念可信度。在五个数据集和十个架构上的实验证明，在没有使用任何概念定位注释的情况下，我们的模型显著提高了概念的可信度，并且比现有技术取得了更高的准确性。

Mar, 2024

瓶颈模型中的跨模式概念化

通过跨模态学习方法，我们在训练中使用文本描述来指导概念的引入，以产生可解释的概念，提高模型的健壮性。

Oct, 2023

理解和增强基于概念模型的鲁棒性

本研究旨在研究基于概念模型的鲁棒性和输出一致性的表现，提出并分析了不同的恶意攻击方式，并提出了基于对抗训练的防御机制，探讨了它们对模型在系统性扰动下的鲁棒性，发现所提出的防御方法可以提高概念模型的鲁棒性。

Nov, 2022

学习可推广基于概念的模型的辅助损失

我们通过引入概念瓶颈模型（CBMs）和合作 - 概念瓶颈模型（coop-CBM）以及概念正交损失（COL），在各种分布转移设置下的实验中，提出了一种提高神经网络透明度和性能的方法。

Nov, 2023