BriefGPT.xyz
Ask
alpha
关键词
professional translators
搜索结果 - 5
ACL
通过稳定的排名概率寻找可复制的人类评估
本文以机器翻译及其人类评估框架 MQM 为案例研究,旨在探讨如何建立可靠的人类评估,以获得稳定的结论,并提供设计可复制的人类评估研究的具体建议,同时发布了由多名专业翻译人员评分的最大公开可用翻译数据集。
PDF
3 months ago
Milimili. 通过众包收集平行数据
通过众包的方法,我们提供了一种收集平行语料库的方法,尽管牺牲了质量,但它比雇佣专业翻译人员更具成本效益。此外,我们还提供了收集的车臣语 - 俄语和富拉语 - 英语语言对的实验性平行数据。
PDF
a year ago
FLORES-101 低资源和多语言机器翻译评估基准
本文介绍了 FLORES-101 评估基准,该数据集由 3001 句从英文维基百科中提取出来的涵盖各种主题和领域的句子,在 101 种语言中由专业翻译人员进行翻译。该数据集可用于评估低资源语言和多对多多语言翻译系统的模型质量。
PDF
3 years ago
专家、误差与上下文:人工评估机器翻译的大规模研究
研究机器翻译质量评估的难点在于缺乏标准程序及评估方法的计量问题。本研究提出一套基于明示错误分析及 MQM 框架的评估方法,并应用于 WMT 2020 挑战赛的两个语言对中来自高水平机器翻译模型的输出进行评估。评估结果与 WMT 众包评估结果
→
PDF
3 years ago
人工神经网络翻译中人类表现的重新评估:实现不可实现的目标?
本文重新评估了一项最近的研究 (Hassan et al.,2018),即使用成对排序法并考虑到三个变量,重申机器翻译在从中文到英文的新闻翻译方面已达到人类水平,我们提供了一组人类评估未来机器翻译的建议。
PDF
6 years ago
Prev
Next