ICLRMay, 2022

事后概念瓶颈模型

TL;DR本研究介绍后续概念瓶颈模型(PCBM),它可以将任何神经网络转换为具有解释性的概念瓶颈模型,无需在训练数据中密集注释概念,同时保持模型性能和解释性优势。PCBM 还可以从其他数据集或自然语言描述中通过多模式模型转移概念,从而实现全局模型编辑。通过用户研究表明,通过概念层反馈编辑 PCBM 可以在不使用目标域或模型重新训练的数据的情况下,显著提高性能。