BriefGPT.xyz
Ask
alpha
关键词
faithfulness evaluation
搜索结果 - 3
EMNLP
对话摘要中忠实度的分析和评估
本文提出了一种系统评估对话摘要的方法,并通过人工分析发现现有模型中有超过 35% 生成的摘要与原始对话不符,其评估工具与样本数据可用于未来的研究。
PDF
2 years ago
评估文本分类输入显著性方法的忠实度协议:您能发现这些捷径吗?
本文提出了一种研究模型特征重要性的方法,并对四种标准输入明显性方法在文本分类和模型调试场景下的效果进行了深入分析,并建议针对每种新任务 - 模型组合采用该方法以找到找到最佳的快捷方式识别方法。
PDF
3 years ago
ACL
FEQA: 抽象摘要中忠实度评估的问答评估框架
该研究提出了一种基于自动问答的 faithfulness 评估度量方式(FEQA),并发现当前的神经抽象概括模型存在抽象度和忠实度的权衡关系。
PDF
4 years ago
Prev
Next