通过受限模仿学习实现灵活策略的同时翻译

Jun, 2019

通过受限模仿学习实现灵活策略的同时翻译

Simultaneous Translation with Flexible Policy via Restricted Imitation Learning

Baigong Zheng, Renjie Zheng, Mingbo Ma, Liang Huang

TL;DR本研究介绍了一种使用延迟标记和受限动态 Oracle 进行简化训练的单模型策略进行同时翻译优化，实验结果表明，相比固定和强化学习策略，该方法能够实现更好的 BLEU 分数和更低的延迟。

Abstract

simultaneous translation is widely useful but remains one of the most difficult tasks in nlp. Previous work either uses fixed-latency policies, or train a complicated two-staged model using reinforcement learning

simultaneous translation nlp delay token dynamic oracle bleu scores

发现论文，激发创造

简单快速学习适应性同传策略

提出了一种简单的监督学习框架，从并行文本生成的 oracle READ / WRITE 序列中学习自适应策略来结合固定延迟策略和自适应策略的优点以实现更好的 BLEU 分数和相似的延迟，同时无需重新训练基础的神经机器翻译模型。

Sep, 2019

同时翻译策略：从固定到自适应

通过简单的启发式组合一组固定策略，我们设计了一种算法来实现自适应策略，实验结果显示我们的自适应策略可以在相同延迟下比固定策略多达 4 个 BLEU 分数，并且甚至在贪心模式下超过了全句翻译的 BLEU 分数（接近 beam 模式），但延迟更低。

Apr, 2020

数据驱动的自适应同时机器翻译

本文提出一种用于自适应 SimulMT 训练的有效方案，通过向训练语料库中添加自适应前缀对前缀的语句，来缓解 Wait-K 策略的两个主要限制，实验证明该方法在翻译质量和延迟方面优于所有强基准线。

Apr, 2022

STACL: 前缀到前缀框架的隐含预测与可控延迟的同时翻译

该研究提出了一种基于前缀的预测模型，采用 wait-k 策略来实现当前缀的翻译，并在中英文和德英文四个方向上实现了较低的延迟和合理的质量。

Oct, 2018

利用多模态增强学习进行同时机器翻译

本研究探索了两个主要概念，即使用自适应策略来学习高翻译质量和低延迟之间的平衡，以及使用可用于生成文本输入之前的附加（视觉）上下文信息来支持该过程，提出了一种多模式方法来进行同时机器翻译，并采用强化学习策略，应用于代理程序和环境中集成视觉和文本信息，研究了不同类型的视觉信息和集成策略对同时翻译模型质量和延迟的影响，并证明了视觉线索可以在保持延迟低的同时提高质量。

Feb, 2021

通过二分搜索学习同时机器翻译的最优策略

本文提出了一种利用二分查找在线构建最佳策略的方法来实现并行句子翻译的优化，通过显式监管来实现最优策略的学习，从而在所有延迟情况下超越了强基线。

May, 2023

基于神经机器翻译的实时翻译学习

本论文提出了一种基于神经机器翻译的实时翻译框架，通过代理决策来实现翻译输出实时化并且具有可控的翻译质量与延迟，通过在两种语言对上的实验结果表明了该方法在定量与定性方面的有效性。

Oct, 2016

SiLLM：大型语言模型用于同步机器翻译

同时机器翻译 (SiMT) 使用一个策略来确定最佳的阅读和生成单词的时机。我们提出了 SiLLM，将 SiMT 任务分解为策略决策和翻译子任务，并引入了大型语言模型 (LLM)。两个代理协作完成 SiMT，最终实现了最新技术水平的性能表现。

Feb, 2024

混合专家等候 - k 策略的通用同时翻译机

本论文提出了一种基于 Mixture-of-Experts Wait-k 机制的通用即时翻译模型，采用多头注意力实现专家混合，每个专家根据其自己的等待词数被认为是 wait-k 专家，并根据测试延迟和源输入调整专家权重以产生最佳翻译，可以在任意延迟下实现最佳翻译质量，实验结果表明，该方法优于现有方法。

Sep, 2021

将固定转为自适应：将后评估集成到同时机器翻译中

本文提出了一种将后评估集成到固定策略中的方法，通过测量源内容的变化来评估下一个操作的合理性，并根据评估结果采取不同的操作，这种自适应策略在三项翻译任务中均优于强基准线。

Oct, 2022