BriefGPT.xyz
Ask
alpha
关键词
human evaluation datasets
搜索结果 - 1
ACL
使用关键词权重的生成式问答度量 KPQA
本研究提出了一种新的度量模型 KPQA-metric,通过关键词预测为不同的令牌分配不同的权重评估生成的回答,用于评估生成式问答系统的正确性,并通过人类评估数据集表明,KPQA-metric 与现有度量模型具有更高的相关性。
PDF
4 years ago
Prev
Next