WMT 2022 翻译建议共享任务发现

EMNLPNov, 2022

Findings of the WMT 2022 Shared Task on Translation Suggestion

Zhen Yang, Fandong Meng, Yingxue Zhang, Ernan Li, Jie Zhou

TL;DRWMT 共享任务中，我们获得了 92 个参与队伍提交的数据，使用 BLEU 自动评估指标对机器翻译中的翻译建议进行了评估，并提供了英德和英汉语料库来进行两个子任务的翻译建议。

Abstract

We report the result of the first edition of the WMT shared task on translation suggestion (TS). The task aims to provide alternatives for specific words or phrases given the entire documents generated by machine transl

machine translation translation suggestion corpus submissions bleu

发现论文，激发创造

TSMind：阿里巴巴与苏州大学 WMT22 翻译建议任务的提交

该研究使用下游任务上的模型典范微调的方式，以最近取得巨大成功的巨型规模预训练模型为基础，并采用数据增强技术和条件交叉熵模型以提高机器翻译的性能，最终在 WMT22 中 Naive TS 任务的四个语言方向中的三个中排名第一。

Nov, 2022

WeTS: 一个翻译建议的基准测试

We created a benchmark data set called WeTS, which includes human-annotated golden corpus and synthetic corpus to improve the performance of Translation Suggestion (TS) for post editing after machine translation (MT). Our Transformer-based model achieves State-Of-The-Art (SOTA) results on four translation directions: English-to-German, German-to-English, Chinese-to-English and English-to-Chinese.

Oct, 2021

改进的翻译建议数据增强

介绍了我们在 WMT'22 翻译建议共享任务中提交的系统，该系统基于多种翻译架构的集合，并使用三种策略构建合成数据以补偿监督数据的缺乏，并引入多阶段预训练策略，并在英德和英汉双向任务中排名第二和第三。

Oct, 2022

机器翻译鲁棒性首次共享任务结果

该论文介绍了首个旨在提高机器翻译鲁棒性的共享任务的研究成果，共有 11 个团队提交了 23 个系统，人工评估和自动评估 (BLEU) 均显示很高的相关性，系统均有大幅度的改进，最佳系统较基准系统提高了 22.33 个 BLEU 分值。

Jun, 2019

微软提交 WMT2018 新闻翻译任务报告：如何不再担忧，爱上数据

本文介绍了微软参加 WMT2018 新闻翻译共享任务的提交，对于英语到德语的一种语言方向中，基于最佳实践，采用了最先进的模型和新数据过滤和句子加权方法来训练在 Paracrawl 上实验结果表明，根据自动指标 (BLEU)，我们在此子任务中得分最高，比接下来最强大的系统高近 2 BLEU 分数，根据人工评估，我们在受限系统中排名第一，我们认为这主要是由于我们的数据过滤 / 加权组合的实施。

Sep, 2018

爱丁堡大学 WMT22 杂语共享任务的提交（MixMT）

该研究旨在解决低资源条件下代码混合翻译的问题，在数据生成和典藏方面投入了大量精力，通过限制解码效果得出最佳翻译结果，使用现有的机器翻译模型和对齐增强的预训练技术进行探索，最终实现了对应子任务最佳表现。

Oct, 2022

基于大型预训练模型的流畅翻译 ——MixMT 2022 SIT

本论文介绍了史蒂文斯理工学院提交的 WMT 2022 共享任务：混合代码机器翻译并针对该任务的两个子任务的技术改进，包括采用大型预训练多语言 NMT 模型和领域内数据集以及反向翻译和集成技术等，该系统取得了子任务 2 上的第一名和子任务 1 上的第一和第三名。

Oct, 2022

上海交通大学 - 国立信息学研究所的 WMT20 新闻翻译任务所使用的监督式和无监督式神经机器翻译系统

本文介绍了我们在 WMT2020 机器翻译共享任务中的参与情况和采用的多项神经机器翻译技术，在英汉、波兰英语和德国上索布里亚语等四个方向中，我们获得了第一名的好成绩。

Oct, 2020

文本清晰与全身变形器：微软参加 WMT22 共享任务的手语翻译提交

本文介绍微软对 WMT 2022 年第一次手语翻译共享任务的提交结果，展示了一种基于动作识别的全身信息提取、标准 Transformer 网络应用、目标文本数据清理的手语翻译系统，该系统在测试集和开发集上的 BLEU 得分是参与者中最好的，并在人类评估中获得第一名，同时在开发集上应用唇读模型提取的特征进一步提高了 BLEU 得分。

Oct, 2022

WMT22 通用机器翻译任务的自动评估

本文介绍了第七届机器翻译会议的机器翻译任务自动评估，其中评估了 185 种系统，包括高资源到低资源语言对和从密切相关到远离的语言。自动度量标准 chrF、BLEU 和 COMET 可以相互补充以减轻解释性和准确性方面的限制，并凸显了当前最先进的机器翻译系统的一些局限性。

Sep, 2022