IJCAISep, 2023

自动概念嵌入模型 (ACEM): 无需训练时间概念,无问题!

TL;DR神经网络的可解释性和解释能力在特别是在安全关键领域和提供社会解释权方面不断增加。定概念解释在线合人类推理的方式上效果良好,是一种很好的解释模型的方法。概念嵌入模型是一种基于概念的解释架构,已经证明在解释能力和性能之间取得了平衡。然而,它们存在一个关键限制 -- 需要为所有训练数据提供概念注释。针对这一问题,我们提出了自动概念嵌入模型(ACEMs),可以自动学习概念注释。