BriefGPT.xyz
大模型
Ask
alpha
关键词
automatic text generation metrics
搜索结果 - 1
ACL
对长篇问答评估的关键评估
对长篇答案进行有针对性的评估研究,强调评估多维度因素,发现自动文本生成的评价指标不能预测人类喜好,建议未来的评估中,应该注重准确性、完整性和客观性等多个方面。
PDF
a year ago
Prev
Next