Nov, 2023

概念提炼:利用人类中心解释提升模型性能

TL;DR我们将 CAVs 从事后分析扩展到事前训练,通过使用额外的概念损失进行微调来减少模型偏差。我们还引入了概念蒸馏,使用预训练的知识模型作为教师来创建更丰富的概念。我们展示了概念敏感训练在去偏、分类问题和重建问题中的应用,可以提高模型的可解释性,减少偏差并引入先验知识。