非分段输入的同步翻译：滑动窗口方法

Oct, 2022

非分段输入的同步翻译：滑动窗口方法

Simultaneous Translation for Unsegmented Input: A Sliding Window Approach

Sukanta Sen, Ondřej Bojar, Barry Haddow

TL;DR提出一种基于滑动窗口的方法来翻译语音识别输出，实验结果表明比传统的 ASR 分段方法提高了 1.3-2.0 BLEU 分数，且减少了重新翻译的需要。

Abstract

In the cascaded approach to spoken language translation (SLT), the asr output is typically punctuated and segmented into sentences before being passed to →

spoken language translation asr mt sliding window approach translation models

发现论文，激发创造

通过潜在对齐分段实现长篇连贯语音翻译

提出一种新的分割方法，用于低延迟的端到端同时语音翻译，并且在多种语言对和领域数据中显示出具有先进水平的质量。

Sep, 2023

利用同步的流式 ASR 辅助的直接同声传译

本文提出一种新型的语音翻译范例，通过使用两个分离但同步的解码器，一个用于流式 ASR, 一个用于直接语音翻译，并通过 ASR 生成的中间结果指导直接语音翻译，实现了流畅度更高的翻译质量。

Jun, 2021

不要在语音到文本翻译中放弃固定窗口音频分割

本研究比较了不同方法对提高在线口译的鲁棒性的效果，并在离线和在线设置中测试了不同的分段策略，研究结果表明，在适当的条件下，简单的固定窗口音频分段可以表现出惊人的性能。

Oct, 2022

无分割流式机器翻译

提出一种无分割的框架，能够在生成翻译之前延迟分割决策，以在实时流中实现无分割的源流翻译，该框架在质量和延迟方面具有更好的权衡。

Sep, 2023

面向口语理解和同时语音翻译的分块流式 Transformer

本研究提出基于块状，流式 Transformer 的方法，通过流式处理和块状并行检索，在同时进行自然语言理解和语音翻译等多个语音处理任务中，实现实时处理并取得与离线模型相当甚至更高的性能表现，并通过引入自动语音识别中间层损失约束和跨语言编码方法等方式进一步提高分类性能和模型表现。

Apr, 2022

基于对齐分块的神经同声传译

提出了一种用于机器翻译的神经网络模型，其能够动态决定何时继续输入源文本或生成翻译文本，通过使用单向或双向编码器来处理实际语音和文本输入，使用词对齐方法生成分块训练数据，并在 IWSLT 2020 英 - 德任务上优于 wait-k 基线 2.6 到 3.7% BLEU 中的结果。

May, 2020

长篇同传口译的再翻译策略

本研究针对如何实现长篇演讲等语音内容的同声传译问题，采用重新翻译的方式进行同步翻译，并提出了优化应用工具以加强稳定性的方法。研究结果表明，这种方法不仅延迟极低，翻译结果也具有高质量，能够轻易地进行多语言翻译。

Dec, 2019

通过利用流式历史将机器翻译从同时转换为流式转换

该研究拓展了现有的同声翻译系统，提出一种基于流历史的流机器翻译方法，取得了较大的质量提升，并且表现优于现有同类最佳系统。

Mar, 2022

同时机器翻译的流级延迟评估

本文提出了基于重新划分的流级别延迟评估方法，较好地适用于连续的流翻译，并在参考 IWSLT 任务的流式条件下得到成功评估。

Apr, 2021

使用增强记忆变换器的流播同声传译

本文提出了一种针对实时应用场景的端到端增强记忆 Transformer 编码器，成功地应用于流式同声传译任务，可以处理大量连续输入，相较于单向掩码 Transformer 模型，具有更好的延迟和质量平衡。

Oct, 2020