学习可推广基于概念的模型的辅助损失
本文提出了一种基于概念瓶颈模型的新型可解释模型,集成了监督和无监督概念,减少了计算量,同时取得了比 CBM 和 SENN 更优异的实验效果,并可视化每个概念的显著性图,符合语义意义。
Feb, 2022
提出了一种使用概念瓶颈模型 (CBMs) 进行可解释分类的新架构和方法,该方法能够提供解读结果,通过引入称为概念瓶颈层的新类型层,训练 CBMs 取得了显著的准确度提升,并且通过概念矩阵搜索算法改进了复杂数据集上的预测结果。
Apr, 2024
本研究介绍后续概念瓶颈模型(PCBM),它可以将任何神经网络转换为具有解释性的概念瓶颈模型,无需在训练数据中密集注释概念,同时保持模型性能和解释性优势。PCBM 还可以从其他数据集或自然语言描述中通过多模式模型转移概念,从而实现全局模型编辑。通过用户研究表明,通过概念层反馈编辑 PCBM 可以在不使用目标域或模型重新训练的数据的情况下,显著提高性能。
May, 2022
通过对比性语言图像模型和单一稀疏线性层,我们提出了一个简单而直观的可解释框架,通过基于贝叶斯推理的数据驱动伯努利分布来实现框架中的稀疏性,相比相关方法,在准确性和每个样本概念稀疏性方面均表现出色,为新概念的个体研究提供便利。
Aug, 2023
通过建模概念间的依赖关系并引入分布参数化,提出了一种基于概念瓶颈模型的新方法,通过影响相关概念来提高干预效果,并展示了其在合成表格和自然图像数据集上显著提高干预效果的经验证据,同时还通过对 CLIP 推导的概念进行检验来展示 SCBMs 的多功能性和可用性,减少了人工概念注释的需求。
Jun, 2024
提出了一种新的框架 Label-free CBM,能够将任何神经网络转换成可解释的 CBM,而无需标记的概念数据,且准确性高,并成功地将其扩展到 ImageNet 数据集上,整个创建过程只需要几个小时,未来能在实际的实际场景中大规模应用。
Apr, 2023
本研究旨在研究基于概念模型的鲁棒性和输出一致性的表现,提出并分析了不同的恶意攻击方式,并提出了基于对抗训练的防御机制,探讨了它们对模型在系统性扰动下的鲁棒性,发现所提出的防御方法可以提高概念模型的鲁棒性。
Nov, 2022
我们提出了递增残差概念瓶颈模型(Res-CBM),以解决概念完整性的挑战。通过优化向量来完成缺失的概念,并将不明确含义的补充向量转化为候选概念库中的潜在概念,以增强任何 CBM 的性能。实验结果表明,Res-CBM 在准确性和效率方面优于当前最先进的方法,并在多个数据集上实现了与黑盒模型相当的性能。
Apr, 2024