BriefGPT.xyz
Ask
alpha
关键词
parascore
搜索结果 - 1
关于释义生成的评估度量
本文重新审视了用于复述评估的自动评估度量,并得出两个违背常规智慧的发现:(1) 无参考度量比基于参考文本的度量具有更好的性能。 (2) 人类注释与使用最多的度量不太相符。通过额外的实验证明和深入的分析探讨了上述发现背后的原因。 基于实验和分
→
PDF
2 years ago
Prev
Next