Dec, 2023

提升自解释理性化的理据-输入一致性

TL;DR通过合作游戏,合理化赋予深度学习模型自我解释能力;本研究发现理性化容易出现的理性转移问题;为解决这个问题,提出一种新方法DAR,通过辅助模块对齐选定理性和原始输入;实验证明DAR显著提高了解释质量,并在两个合成设置上进一步验证了其有效性。