可编辑的概念瓶颈模型
本研究介绍后续概念瓶颈模型(PCBM),它可以将任何神经网络转换为具有解释性的概念瓶颈模型,无需在训练数据中密集注释概念,同时保持模型性能和解释性优势。PCBM 还可以从其他数据集或自然语言描述中通过多模式模型转移概念,从而实现全局模型编辑。通过用户研究表明,通过概念层反馈编辑 PCBM 可以在不使用目标域或模型重新训练的数据的情况下,显著提高性能。
May, 2022
我们提出了基于能量的概念瓶颈模型(ECBMs),通过使用一组神经网络定义候选(输入、概念、类别)元组的联合能量,以解决现有概念瓶颈模型存在的限制,提供更高的准确性和更丰富的概念解释。
Jan, 2024
通过建模概念间的依赖关系并引入分布参数化,提出了一种基于概念瓶颈模型的新方法,通过影响相关概念来提高干预效果,并展示了其在合成表格和自然图像数据集上显著提高干预效果的经验证据,同时还通过对 CLIP 推导的概念进行检验来展示 SCBMs 的多功能性和可用性,减少了人工概念注释的需求。
Jun, 2024
我们提出了递增残差概念瓶颈模型(Res-CBM),以解决概念完整性的挑战。通过优化向量来完成缺失的概念,并将不明确含义的补充向量转化为候选概念库中的潜在概念,以增强任何 CBM 的性能。实验结果表明,Res-CBM 在准确性和效率方面优于当前最先进的方法,并在多个数据集上实现了与黑盒模型相当的性能。
Apr, 2024
传统的深度学习模型缺乏解释性,概念瓶颈模型(CBMs)通过其概念表示提供内在解释。本文提出了概念瓶颈记忆模型(CB2M),通过两重记忆,CB2M 能够在新情境中学习推广干预,纠正模型的预测结果,从而自动改进模型性能。实验结果表明 CB2M 可以成功地推广到未见数据并识别错误的概念,是用户提供 CBM 互动反馈的一种有效工具。
Aug, 2023
概念瓶颈模型是一种具有内在可解释性的模型,本文研究了如何通过细粒度概念注释的数据集学习概念,并通过移除问题概念相关性来实现概念与输入特征之间的语义映射,通过引入基于纸牌领域的合成图像数据集作为未来研究的基准,以及在胸部 X 光数据集上的实证研究来验证概念在实际应用中的可学习性。
Feb, 2024
我们提出了一个名为 SSCBM 的新框架,通过在标记和未标记数据上进行联合训练,并在概念层面对未标记数据进行对齐,解决了现有 CBMs 训练中的限制。实验证明我们的 SSCBM 既有效又高效,在仅有 20% 标记数据的情况下,实现了 93.19%(在完全监督设置下为 96.39%)的概念准确性和 75.51%(在完全监督设置下为 79.82%)的预测准确性。
Jun, 2024
我们通过引入概念瓶颈模型(CBMs)和合作 - 概念瓶颈模型(coop-CBM)以及概念正交损失(COL),在各种分布转移设置下的实验中,提出了一种提高神经网络透明度和性能的方法。
Nov, 2023