Conversational SimulMT: 大型语言模型的高效实时翻译

Feb, 2024

Conversational SimulMT: 大型语言模型的高效实时翻译

Conversational SimulMT: Efficient Simultaneous Translation with Large Language Models

Minghan Wang, Thuy-Trang Vu, Ehsan Shareghi, Gholamreza Haffari

TL;DR这篇论文提出了一种基于 LlM 的对话式 SimulMT 框架，通过多轮对话解码提高 LLM 的推理效率，在两个 SimulMT 基准测试中展示了 LLM 在翻译质量上的优越性以及与专用 SimulMT 模型相当的计算延迟。

Abstract

simultaneous machine translation (SimulMT) presents a challenging trade-off between translation quality and latency. Recent studies have shown that →

simultaneous machine translation llms inference efficiency multi-turn-dialogue-based decoding translation quality

发现论文，激发创造

大语言模型的同时机器翻译

利用大型语言模型进行同传机器翻译，在训练推理不匹配的问题上引入了简单而有效的混合策略，并且通过在完整和前缀句子的混合训练上进行监督微调，实现了显著的性能改进，证明大型语言模型可以在翻译质量和延迟方面达到与专用同传机器翻译模型相当的水平。

Sep, 2023

Simul-LLM：一个探索使用大型语言模型进行高质量同时翻译的框架

大型语言模型在神经机器翻译中的应用被广泛研究，本文关注于将大型语言模型 fine-tuning 用于较困难的同时翻译任务，验证了经典方法在大型语言模型上的有效性，探索了将用于机器翻译的大型语言模型调整为同时翻译任务的适应方法，并引入 Simul-LLM，首个专注于同时翻译任务的开源 fine-tuning 和评估流程框架。

Dec, 2023

TransLLaMa: 基于 LLM 的同步翻译系统

经过小规模数据集上的微调后，预训练的开源解码器 - 仅模型可以通过生成特殊的 “等待” 标记直接控制输入分段，从而在同时翻译任务中达到与最先进基准模型相媲美的 BLEU 分数；尚未进行先前训练的闭源模型在此任务中显示出令人鼓舞的结果，为改进未来的同时翻译系统指明了一个有希望的方向。

Feb, 2024

LLMs 是零射击上下文感知的同时翻译器

大型语言模型在同时机器翻译任务中表现出与某些最先进基准系统相当或更好的性能，并且注入最少的背景信息（容易实现）可以进一步提高性能，尤其是在具有挑战性的技术主题上。这凸显了大型语言模型构建下一代大规模多语言、上下文感知和术语准确的同时翻译系统的潜力，而无需资源密集型的训练或微调。

Jun, 2024

SiLLM：大型语言模型用于同步机器翻译

同时机器翻译 (SiMT) 使用一个策略来确定最佳的阅读和生成单词的时机。我们提出了 SiLLM，将 SiMT 任务分解为策略决策和翻译子任务，并引入了大型语言模型 (LLM)。两个代理协作完成 SiMT，最终实现了最新技术水平的性能表现。

Feb, 2024

无需预测的同步机器翻译训练

本文提出了一种将翻译过程分解为单调翻译和重新排序步骤的新框架，并通过辅助排序网络模型来模拟其中的重新排序步骤，从而提高了同时翻译模型的翻译效果。

Jan, 2022

数据驱动的自适应同时机器翻译

本文提出一种用于自适应 SimulMT 训练的有效方案，通过向训练语料库中添加自适应前缀对前缀的语句，来缓解 Wait-K 策略的两个主要限制，实验证明该方法在翻译质量和延迟方面优于所有强基准线。

Apr, 2022

Agent-SiMT：基于大型语言模型的代理辅助同时机器翻译

同时机器翻译（SiMT）通过阅读源语句来生成目标翻译，在确定最佳时机阅读句子和生成翻译的策略方面，现有的 SiMT 方法通常采用传统的 Transformer 架构，虽然它们擅长确定策略，但其翻译性能却不够优化。相反，基于丰富语料库训练的大型语言模型（LLMs）具有卓越的生成能力，但它们很难通过 SiMT 的训练方法获得翻译策略。因此，我们引入 Agent-SiMT，这是一个将 LLMs 和传统 SiMT 方法的优势结合起来的框架。Agent-SiMT 包含策略决策代理和翻译代理。策略决策代理由一个 SiMT 模型管理，使用部分源语句和翻译来确定翻译策略。而翻译代理则利用 LLM 基于部分源语句生成翻译。这两个代理共同合作完成 SiMT。实验证明，Agent-SiMT 达到了最先进的性能。

Jun, 2024

从 SimulMT 到 SimulST: 将同时翻译文本转换为端到端同时翻译语音

本文调查了如何将同步文本翻译方法与同时语音翻译相结合，并通过引入预决定模块来适应于端到端的同时语音翻译。同时，对将固定和灵活的预决策与固定和灵活的策略相结合的延迟质量权衡进行了详细分析。作者还设计了一种新的计算感知的延迟度量方法，该方法从平均滞后进行调整。

Nov, 2020

同时屏蔽，不是提示优化：同传中微调语言模型的范式转变

利用一种名为 SimulMask 的新模式，通过在 Fine-tuning 期间通过屏蔽注意力连接来建模即时翻译，成功解决了一系列问题，从而使大语言模型在同时翻译任务中取得了显著提升的翻译质量，并减少了计算成本。

May, 2024