Feb, 2024

我们能约束概念瓶颈模型学习语义有意义的输入特征吗?

TL;DR概念瓶颈模型是一种具有内在可解释性的模型,本文研究了如何通过细粒度概念注释的数据集学习概念,并通过移除问题概念相关性来实现概念与输入特征之间的语义映射,通过引入基于纸牌领域的合成图像数据集作为未来研究的基准,以及在胸部 X 光数据集上的实证研究来验证概念在实际应用中的可学习性。