BriefGPT.xyz
Ask
alpha
关键词
document-level evaluation
搜索结果 - 3
ACL
关于机器翻译结果的大规模文档层面人工评估用户界面
研究发现,针对机器翻译的人工评估需要考虑文本上下文,然而用户界面对于标注者的生产力和评估可靠性的影响却鲜有研究。本文通过比较两种不同方法获得的人工评估数据,证明了一个以文档为中心的评估方法可以提高数据的质量,但却需要更多的时间投资。
PDF
3 years ago
ACL
BlonDe:一种用于文档级机器翻译的自动评估指标
本文提出了一种新型的自动评估方法 BlonDe,通过将话语连贯性考虑在内来扩大自动翻译评估的范围,从句子级别提高到文档级别,该方法能够更好地区分文档级别的翻译质量改进和句子级别的改进,并且具有更好的判别性、可解释性和敏感性。在大规模的人类研
→
PDF
3 years ago
EMNLP
机器翻译达到人类水平了吗?文档级别评估的案例分析
在文档级翻译评估中,人类对于独立句子评价更偏向于人类翻译而非机器翻译,强调了机器翻译向文档级评价迈进的必要性。
PDF
6 years ago
Prev
Next