学习可推广基于概念的模型的辅助损失

Nov, 2023

学习可推广基于概念的模型的辅助损失

Auxiliary Losses for Learning Generalizable Concept-based Models

Ivaxi Sheth, Samira Ebrahimi Kahou

TL;DR我们通过引入概念瓶颈模型（CBMs）和合作 - 概念瓶颈模型（coop-CBM）以及概念正交损失（COL），在各种分布转移设置下的实验中，提出了一种提高神经网络透明度和性能的方法。

Abstract

The increasing use of neural networks in various applications has lead to increasing apprehensions, underscoring the necessity to understand their operations beyond mere final predictions. As a solution to enhance model transparency, →

neural networks concept bottleneck models model transparency concept representations distributional shift

发现论文，激发创造

具有额外无监督概念的概念瓶颈模型

本文提出了一种基于概念瓶颈模型的新型可解释模型，集成了监督和无监督概念，减少了计算量，同时取得了比 CBM 和 SENN 更优异的实验效果，并可视化每个概念的显著性图，符合语义意义。

Feb, 2022

稀疏概念瓶颈模型：对比学习中的 Gumbel 技巧

提出了一种使用概念瓶颈模型 (CBMs) 进行可解释分类的新架构和方法，该方法能够提供解读结果，通过引入称为概念瓶颈层的新类型层，训练 CBMs 取得了显著的准确度提升，并且通过概念矩阵搜索算法改进了复杂数据集上的预测结果。

Apr, 2024

事后概念瓶颈模型

本研究介绍后续概念瓶颈模型（PCBM），它可以将任何神经网络转换为具有解释性的概念瓶颈模型，无需在训练数据中密集注释概念，同时保持模型性能和解释性优势。PCBM 还可以从其他数据集或自然语言描述中通过多模式模型转移概念，从而实现全局模型编辑。通过用户研究表明，通过概念层反馈编辑 PCBM 可以在不使用目标域或模型重新训练的数据的情况下，显著提高性能。

May, 2022

概念瓶颈模型是否遵循局部性？

CBMs 在局部和相似度方面无法准确捕捉概念的条件独立性，这对于 CBMs 学习的概念表示的质量以及基于概念的解释的鲁棒性产生了质疑。

Jan, 2024

稀疏线性概念发现模型

通过对比性语言图像模型和单一稀疏线性层，我们提出了一个简单而直观的可解释框架，通过基于贝叶斯推理的数据驱动伯努利分布来实现框架中的稀疏性，相比相关方法，在准确性和每个样本概念稀疏性方面均表现出色，为新概念的个体研究提供便利。

Aug, 2023

随机概念瓶颈模型

通过建模概念间的依赖关系并引入分布参数化，提出了一种基于概念瓶颈模型的新方法，通过影响相关概念来提高干预效果，并展示了其在合成表格和自然图像数据集上显著提高干预效果的经验证据，同时还通过对 CLIP 推导的概念进行检验来展示 SCBMs 的多功能性和可用性，减少了人工概念注释的需求。

Jun, 2024

使用监督、层次概念学习消除硬概念瓶颈模型中的信息泄漏

提供标签监督和层次化概念集概念预测模式，SupCBM 消除信息泄漏问题，实现准确预测和解释。

Feb, 2024

无标记概念瓶颈模型

提出了一种新的框架 Label-free CBM，能够将任何神经网络转换成可解释的 CBM，而无需标记的概念数据，且准确性高，并成功地将其扩展到 ImageNet 数据集上，整个创建过程只需要几个小时，未来能在实际的实际场景中大规模应用。

Apr, 2023

理解和增强基于概念模型的鲁棒性

本研究旨在研究基于概念模型的鲁棒性和输出一致性的表现，提出并分析了不同的恶意攻击方式，并提出了基于对抗训练的防御机制，探讨了它们对模型在系统性扰动下的鲁棒性，发现所提出的防御方法可以提高概念模型的鲁棒性。

Nov, 2022

增量残差概念瓶颈模型

我们提出了递增残差概念瓶颈模型（Res-CBM），以解决概念完整性的挑战。通过优化向量来完成缺失的概念，并将不明确含义的补充向量转化为候选概念库中的潜在概念，以增强任何 CBM 的性能。实验结果表明，Res-CBM 在准确性和效率方面优于当前最先进的方法，并在多个数据集上实现了与黑盒模型相当的性能。

Apr, 2024