Aug, 2023

Goodhart 定律在 NLP 的解释基准中适用

TL;DR对于基于显著性的解释方法的研究,存在关于其目的、有效性和相互抵触性的疑虑。本文针对自然语言处理进行了关于评估指标的批判性研究,对两套指标进行了评估,并展示了目前的指标能否准确引导可解释性研究的能力存在疑问,强调有必要对这些指标所要捕捉的内容进行更广泛的重新评估。