提出了一种使用概念瓶颈模型 (CBMs) 进行可解释分类的新架构和方法,该方法能够提供解读结果,通过引入称为概念瓶颈层的新类型层,训练 CBMs 取得了显著的准确度提升,并且通过概念矩阵搜索算法改进了复杂数据集上的预测结果。
Apr, 2024
利用深度学习算法设计了一种多层次概念发现框架,允许人类理解的概念在决策过程中高度解释性,通过图像 - 文本模型和基于数据驱动和稀疏的贝叶斯算法进行多层次概念选择,实验结果表明这种构建不仅胜过最近的 CBM 方法,而且为解释性提供了一个有原则的框架。
Oct, 2023
提出了一种新的框架 Label-free CBM,能够将任何神经网络转换成可解释的 CBM,而无需标记的概念数据,且准确性高,并成功地将其扩展到 ImageNet 数据集上,整个创建过程只需要几个小时,未来能在实际的实际场景中大规模应用。
Apr, 2023
我们通过引入概念瓶颈模型(CBMs)和合作 - 概念瓶颈模型(coop-CBM)以及概念正交损失(COL),在各种分布转移设置下的实验中,提出了一种提高神经网络透明度和性能的方法。
Nov, 2023
通过建模概念间的依赖关系并引入分布参数化,提出了一种基于概念瓶颈模型的新方法,通过影响相关概念来提高干预效果,并展示了其在合成表格和自然图像数据集上显著提高干预效果的经验证据,同时还通过对 CLIP 推导的概念进行检验来展示 SCBMs 的多功能性和可用性,减少了人工概念注释的需求。
Jun, 2024
CBMs 在局部和相似度方面无法准确捕捉概念的条件独立性,这对于 CBMs 学习的概念表示的质量以及基于概念的解释的鲁棒性产生了质疑。
Jan, 2024
本文提出了一种基于概念瓶颈模型的新型可解释模型,集成了监督和无监督概念,减少了计算量,同时取得了比 CBM 和 SENN 更优异的实验效果,并可视化每个概念的显著性图,符合语义意义。
Feb, 2022
本研究旨在研究基于概念模型的鲁棒性和输出一致性的表现,提出并分析了不同的恶意攻击方式,并提出了基于对抗训练的防御机制,探讨了它们对模型在系统性扰动下的鲁棒性,发现所提出的防御方法可以提高概念模型的鲁棒性。
Nov, 2022
通过跨模态学习方法,我们在训练中使用文本描述来指导概念的引入,以产生可解释的概念,提高模型的健壮性。
我们提出了一个名为 SSCBM 的新框架,通过在标记和未标记数据上进行联合训练,并在概念层面对未标记数据进行对齐,解决了现有 CBMs 训练中的限制。实验证明我们的 SSCBM 既有效又高效,在仅有 20% 标记数据的情况下,实现了 93.19%(在完全监督设置下为 96.39%)的概念准确性和 75.51%(在完全监督设置下为 79.82%)的预测准确性。