同时机器翻译的展望

Sep, 2023

Glancing Future for Simultaneous Machine Translation

Shoutao Guo, Shaolei Zhang, Yang Feng

TL;DR该研究提出了一种新方法，通过课程学习以逐步减少可用的源信息，从而实现从序列到序列训练到前缀到前缀训练的过渡，以增强同步机器翻译模型的翻译能力。实验证明，该方法优于强基准模型。

Abstract

simultaneous machine translation (SiMT) outputs translation while reading the source sentence. Unlike conventional sequence-to-sequence (seq2seq) training, existing SiMT methods adopt the prefix-to-prefix (prefix2prefix) training, where the model predicts target tokens based on partial

simultaneous machine translation prefix2prefix training seq2seq training curriculum learning translation capability

发现论文，激发创造

CBSiMT: 基于加权前缀对前缀训练的同时翻译中减轻幻觉

我们提出了一种基于置信度的同传机器翻译框架（CBSiMT），通过利用模型置信度来察觉幻觉标记，并通过加权的前缀对前缀训练来减轻它们的负面影响。实验结果表明我们的方法可以在大多数延迟范围内持续提高翻译质量，低延迟时提高 2 个 BLEU 分数。

Nov, 2023

定制参考语境的同时机器翻译

提出了一种通过修改参考文献并使用强化学习方法进行个性化训练的新方法，用于改进不同延迟下训练的同传机器翻译模型的性能。实验证明，该方法在固定和自适应策略下都取得了最先进的性能。

Oct, 2023

利用长度感知框架降低同时机器翻译中的位置偏见

本研究分析了 SiMT 中的位置偏差现象，提出了一个基于长度感知的框架，通过将流输入变成伪满句来消除位置偏差，并成功应用于两个代表性的 SiMT 方法中以提高性能。

Mar, 2022

隐马尔可夫变换器用于同时机器翻译

利用隐马尔科夫模型以及最大化边际似然性训练，提出了一种名为 Hidden Markov Transformer 的模型，用于解决同声机器翻译中好的翻译时间点的挑战。实验表明该模型在多个数据集上优于现有方法并取得了最佳表现。

Mar, 2023

利用视觉上下文的同时机器翻译

本文旨在研究如何利用视觉信息来弥补缺失的源文本背景，评估不同的多模态方法和视觉特征对最先进的同时机器翻译 (SiMT) 框架的影响。结果表明，视觉背景是有帮助的，基于明确的物体区域信息的可视化模型优于常用的全局特征，在低延迟情境下的表现可提高 3 个 BLEU 分数。我们的定性分析展示，只有多模态系统才能正常翻译英语到标记性别的语言，并处理英语和法语之间的形容词和名词词序等差异。

Sep, 2020

无需预测的同步机器翻译训练

本文提出了一种将翻译过程分解为单调翻译和重新排序步骤的新框架，并通过辅助排序网络模型来模拟其中的重新排序步骤，从而提高了同时翻译模型的翻译效果。

Jan, 2022

通过单语数据提高同时机器翻译的效果

该研究提出并探索了使用单语数据来提高同时机器翻译的质量，并提出了新的单语抽样策略，以避免 SiMT 中的幻觉问题，实验表明新策略可以显著提高翻译质量。

Dec, 2022

自调整状态建模的同时机器翻译

利用自我修改状态建模的同时机器翻译（SM^2）训练范式，通过优化每个状态的决策，确保准确优化政策，并通过前缀采样实现充分探索潜在状态，同时保证与双向编码器兼容，从而提高翻译质量。

Jun, 2024

数据驱动的自适应同时机器翻译

本文提出一种用于自适应 SimulMT 训练的有效方案，通过向训练语料库中添加自适应前缀对前缀的语句，来缓解 Wait-K 策略的两个主要限制，实验证明该方法在翻译质量和延迟方面优于所有强基准线。

Apr, 2022

Agent-SiMT：基于大型语言模型的代理辅助同时机器翻译

同时机器翻译（SiMT）通过阅读源语句来生成目标翻译，在确定最佳时机阅读句子和生成翻译的策略方面，现有的 SiMT 方法通常采用传统的 Transformer 架构，虽然它们擅长确定策略，但其翻译性能却不够优化。相反，基于丰富语料库训练的大型语言模型（LLMs）具有卓越的生成能力，但它们很难通过 SiMT 的训练方法获得翻译策略。因此，我们引入 Agent-SiMT，这是一个将 LLMs 和传统 SiMT 方法的优势结合起来的框架。Agent-SiMT 包含策略决策代理和翻译代理。策略决策代理由一个 SiMT 模型管理，使用部分源语句和翻译来确定翻译策略。而翻译代理则利用 LLM 基于部分源语句生成翻译。这两个代理共同合作完成 SiMT。实验证明，Agent-SiMT 达到了最先进的性能。

Jun, 2024