ACLMay, 2021

模型调试解释效用基准测试

TL;DR本文提出需要为后续说明方法建立基准来评估其在完成任务中的效用,并列举了为解决调试文本分类器任务的基准所应具备的理想属性,并强调这种基准不仅有助于评估解释的有效性,还有助于评估其效率。