BriefGPT.xyz
Ask
alpha
关键词
automatic faithfulness metrics
搜索结果 - 1
BUMP: 一个非忠实度测量元评估的基准测试集
本研究提出了不忠实最小分组(BUMP)的基准测试,该数据集由 889 个人类编写的最小不同摘要对组成,摘要来自 CNN / DailyMail 数据集,其中从 7 种类型的本体论引入单个错误以生成不忠实的摘要。该基准测试使度量稳定性的测量成
→
PDF
2 years ago
Prev
Next