EMNLPSep, 2021

外部知识是否有助于可解释的自然语言推断?自动评估与人工评分比较

TL;DR研究了不同来源的外部知识对于解释性自然语言推断系统性能的影响,并发现不同的知识来源对于推理能力有不同的影响,同时进行了最大规模、最精细的可解释 NLI 众包研究,揭示了自动性能分数的巨大差异并没有反映在人的评分上。