ACLMay, 2020

使用关键词权重的生成式问答度量 KPQA

TL;DR本研究提出了一种新的度量模型 KPQA-metric,通过关键词预测为不同的令牌分配不同的权重评估生成的回答,用于评估生成式问答系统的正确性,并通过人类评估数据集表明,KPQA-metric 与现有度量模型具有更高的相关性。