Sep, 2023

学会接受帮助:干预感知的概念嵌入模型

TL;DR通过构建和解释高层概念的预测,概念瓶颈模型(CBMs)解决了神经架构的不透明性。我们提出了一种新的 CBM 基于架构和训练范式的模型,称为 Intervention-aware Concept Embedding models(IntCEMs),通过在训练时学习概念干预策略,有效地选择和接受概念干预,从而在测试时显著提高性能。我们的实验证明,当提供测试时概念干预时,IntCEMs 明显优于最先进的概念可解释模型,验证了我们方法的有效性。