BriefGPT.xyz
Ask
alpha
关键词
intervenability
搜索结果 - 2
超越概念瓶颈模型:如何使黑箱可干预?
介绍了一种在已经训练好但不可解释的神经网络上进行基于概念的干预的方法,并将模型的可干预性定义为评估基于概念的干预效果的度量,通过对模型进行微调来改进干预效果并提高预测的校准性。实验结果表明,精调黑盒模型能够在干预效果上与概念瓶颈模型相媲美且
→
PDF
5 months ago
ICLR
概念瓶颈模型是否学习预期所得?
研究发现概念瓶颈模型很难满足解释性、可预测性和干预性三个目标,使用事后可解释性方法证明概念与输入空间中任何语义上有意义的东西都不对应,因此质疑概念瓶颈模型在目前形式下的实用性。
PDF
3 years ago
Prev
Next