BriefGPT.xyz
Ask
alpha
关键词
n-gram similarity metrics
搜索结果 - 2
ACL
使用关键词权重的生成式问答度量 KPQA
本研究提出了一种新的度量模型 KPQA-metric,通过关键词预测为不同的令牌分配不同的权重评估生成的回答,用于评估生成式问答系统的正确性,并通过人类评估数据集表明,KPQA-metric 与现有度量模型具有更高的相关性。
PDF
4 years ago
评价问答生成系统的更优指标
本文研究了使用 $n$-gram 相识度量(例如 BLEU、NIST 等)来评估自然语言生成(NLG)系统的性能,尤其是其在从文档、知识图谱、图像等中自动生成问题的系统中的应用。研究发现,当前的自动评估指标并不总是能够客观地评估生成问题的可
→
PDF
6 years ago
Prev
Next