BriefGPT.xyz
Ask
alpha
关键词
reference-based evaluation
搜索结果 - 3
在段落级别上训练和元评估机器翻译评估指标
机器翻译中,自动评估指标在评分更长的翻译文本方面的有效性仍不清楚。本文提出了一种通过现有句子级数据创建段落级数据用于训练和元评估指标的方法,并利用这些新数据集对现有句子级指标进行基准测试,以及在段落级训练学习指标。有趣的是,我们的实验结果表
→
PDF
10 months ago
EMNLP
NMTScore: 基于翻译的文本相似度测量方法的多语言分析
本研究基于多语言神经机器翻译的框架,通过分析直接和间接翻译概率以及交叉似然度量的相似度评估方法,研究了这些方法在短文本相似度评估中的性能,提出并实现了基于翻译的相似度评估方法库 NMTScore,并在两项数据生成任务和 17 种语言上进行了
→
PDF
2 years ago
以问答形式作为自动度量指标,评估摘要的内容质量
提出一种基于问答的评估度量标准(QAEval)来评估摘要的内容质量,通过分析 QAEval,证明 QA-based methods 相较于传统的基于文本内部匹配的度量标准(如 ROUGE)更加准确。
PDF
4 years ago
Prev
Next