长度自适应平均滞后策略在同声传译中的应用：不能奖励过度生成

ACLJun, 2022

长度自适应平均滞后策略在同声传译中的应用：不能奖励过度生成

Over-Generation Cannot Be Rewarded: Length-Adaptive Average Lagging for Simultaneous Speech Translation

Sara Papi, Marco Gaido, Matteo Negri, Marco Turchi

TL;DR本文提出了一种新的评估指标 LAAL（Length-Adaptive Average Lagging），并且指出了传统的评估指标 AL（Average Lagging）对于长文本预测的系统评估得分存在低估的问题，同时讨论了当前的 SimulST 系统普遍存在的过度生成（over-generation）问题。该新指标可以提供一种无偏差的评估方法，适用于同时语音翻译领域中既有低生成又有高生成的系统。

Abstract

simultaneous speech translation (SimulST) systems aim at generating their output with the lowest possible latency, which is normally computed in terms of →

simultaneous speech translation latency average lagging over-generation evaluation

发现论文，激发创造

机器翻译同时性的延迟评估思考

该研究介绍了一种称为 Differentiable Average Lagging (DAL) 的潜在模型，可用于追踪同步系统的延迟。该模型可用于同时机器翻译，并在语音转录，实时流媒体和会话翻译方面具有重要应用。

May, 2019

同时机器翻译的流级延迟评估

本文提出了基于重新划分的流级别延迟评估方法，较好地适用于连续的流翻译，并在参考 IWSLT 任务的流式条件下得到成功评估。

Apr, 2021

端到端同步语音翻译的最新进展

该论文提供了对 SimulST 研究的综合概述，着重讨论了四个主要挑战，包括处理长时间和连续的语音流的复杂性、满足实时要求的困难、在翻译质量和延迟限制之间取得平衡的挑战以及缺乏注释数据所带来的复杂性。通过对这些挑战和提出的解决方案的探讨，旨在提供对 SimulST 研究当前现状的宝贵见解，并为未来的探索提出有希望的方向。

Jun, 2024

数据驱动的自适应同时机器翻译

本文提出一种用于自适应 SimulMT 训练的有效方案，通过向训练语料库中添加自适应前缀对前缀的语句，来缓解 Wait-K 策略的两个主要限制，实验证明该方法在翻译质量和延迟方面优于所有强基准线。

Apr, 2022

从 SimulMT 到 SimulST: 将同时翻译文本转换为端到端同时翻译语音

本文调查了如何将同步文本翻译方法与同时语音翻译相结合，并通过引入预决定模块来适应于端到端的同时语音翻译。同时，对将固定和灵活的预决策与固定和灵活的策略相结合的延迟质量权衡进行了详细分析。作者还设计了一种新的计算感知的延迟度量方法，该方法从平均滞后进行调整。

Nov, 2020

自适应训练的流畅低延迟语音同传翻译

提出了一种名为 Self-Adaptive Translation (SAT) 的方法，实现同时语音翻译。该方法通过灵活调整翻译的长度，以适应不同的源语音速率，从而在保持近似的翻译质量的前提下，显著降低了延迟，生成了更流畅自然的目标语音。

Oct, 2020

学习何时发声：离线模型下同时语音翻译中的延迟和质量权衡

本文提出了一种面向实际应用场景的实时语音翻译系统 SimulS2ST，支持 57 种语言对英语的翻译，具备实时调节输出延迟的功能，能够非常快速地进行语音翻译。

Jun, 2023

平均标记延迟：一种用于同时翻译的延迟度量

本研究提出了一种基于平均标记延迟的评估指标（ATD），旨在更好地考虑同声传译中翻译结束时间对延迟的影响，并通过模拟实验和同声传译实验来探讨 ATD 的优势和与平均滞后度之间的差异。

Nov, 2022

Conversational SimulMT: 大型语言模型的高效实时翻译

这篇论文提出了一种基于 LlM 的对话式 SimulMT 框架，通过多轮对话解码提高 LLM 的推理效率，在两个 SimulMT 基准测试中展示了 LLM 在翻译质量上的优越性以及与专用 SimulMT 模型相当的计算延迟。

Feb, 2024

一种非自回归生成框架用于端到端同步任意语音翻译

我们提出了一种新颖的非自回归生成框架用于同时语音翻译 (NAST-S2X)，它将语音到文本和语音到语音任务整合到统一的端到端框架中。实验结果表明，NAST-S2X 在语音到文本和语音到语音任务中优于现有模型，在不到 3 秒的延迟内实现了高质量的同时口译，并在离线生成中提供了 28 倍的解码加速。

Jun, 2024