EMNLPOct, 2020
F1 不够用:面向用户中心的可解释问答模型与评估
F1 is Not Enough! Models and Evaluation Towards User-Centered Explainable Question Answering
Hendrik Schuff, Heike Adel, Ngoc Thang Vu
TL;DR当前可解释的问答系统存在回答与解释耦合度不够的问题,本文提出一种层次模型及新的规范化项来加强回答 - 解释的耦合,并提供两种评估指标来量化耦合,实验结果显示该方法可以提高用户的使用体验和判断系统正确性的能力。