ACLApr, 2020

朝着忠实可解释的自然语言处理系统迈进:我们应该如何定义和评估忠实性?

TL;DR本文探讨了深度学习基础下的 NLP 模型识别问题,并呼吁更明确地区分不同标准,其中聚焦于 “忠实性” 标准。通过调查已有研究文献,将现有方法分为三种假设,并提供了具体指南来评估解释方法。最后,提出当前的 “忠实性” 定义是不真实的二元概念,呼吁使用更优选的渐进性概念。