WMT 2022 翻译建议共享任务发现
该研究使用下游任务上的模型典范微调的方式,以最近取得巨大成功的巨型规模预训练模型为基础,并采用数据增强技术和条件交叉熵模型以提高机器翻译的性能,最终在 WMT22 中 Naive TS 任务的四个语言方向中的三个中排名第一。
Nov, 2022
We created a benchmark data set called WeTS, which includes human-annotated golden corpus and synthetic corpus to improve the performance of Translation Suggestion (TS) for post editing after machine translation (MT). Our Transformer-based model achieves State-Of-The-Art (SOTA) results on four translation directions: English-to-German, German-to-English, Chinese-to-English and English-to-Chinese.
Oct, 2021
介绍了我们在 WMT'22 翻译建议共享任务中提交的系统,该系统基于多种翻译架构的集合,并使用三种策略构建合成数据以补偿监督数据的缺乏,并引入多阶段预训练策略,并在英德和英汉双向任务中排名第二和第三。
Oct, 2022
该论文介绍了首个旨在提高机器翻译鲁棒性的共享任务的研究成果,共有 11 个团队提交了 23 个系统,人工评估和自动评估 (BLEU) 均显示很高的相关性,系统均有大幅度的改进,最佳系统较基准系统提高了 22.33 个 BLEU 分值。
Jun, 2019
本文介绍了微软参加 WMT2018 新闻翻译共享任务的提交,对于英语到德语的一种语言方向中,基于最佳实践,采用了最先进的模型和新数据过滤和句子加权方法来训练在 Paracrawl 上实验结果表明,根据自动指标 (BLEU),我们在此子任务中得分最高,比接下来最强大的系统高近 2 BLEU 分数,根据人工评估,我们在受限系统中排名第一,我们认为这主要是由于我们的数据过滤 / 加权组合的实施。
Sep, 2018
该研究旨在解决低资源条件下代码混合翻译的问题,在数据生成和典藏方面投入了大量精力,通过限制解码效果得出最佳翻译结果,使用现有的机器翻译模型和对齐增强的预训练技术进行探索,最终实现了对应子任务最佳表现。
Oct, 2022
本论文介绍了史蒂文斯理工学院提交的 WMT 2022 共享任务:混合代码机器翻译并针对该任务的两个子任务的技术改进,包括采用大型预训练多语言 NMT 模型和领域内数据集以及反向翻译和集成技术等,该系统取得了子任务 2 上的第一名和子任务 1 上的第一和第三名。
Oct, 2022
本文介绍了我们在 WMT2020 机器翻译共享任务中的参与情况和采用的多项神经机器翻译技术,在英汉、波兰英语和德国上索布里亚语等四个方向中,我们获得了第一名的好成绩。
Oct, 2020
本文介绍微软对 WMT 2022 年第一次手语翻译共享任务的提交结果,展示了一种基于动作识别的全身信息提取、标准 Transformer 网络应用、目标文本数据清理的手语翻译系统,该系统在测试集和开发集上的 BLEU 得分是参与者中最好的,并在人类评估中获得第一名,同时在开发集上应用唇读模型提取的特征进一步提高了 BLEU 得分。
Oct, 2022
本文介绍了第七届机器翻译会议的机器翻译任务自动评估,其中评估了 185 种系统,包括高资源到低资源语言对和从密切相关到远离的语言。自动度量标准 chrF、BLEU 和 COMET 可以相互补充以减轻解释性和准确性方面的限制,并凸显了当前最先进的机器翻译系统的一些局限性。
Sep, 2022