Oct, 2022
非分段输入的同步翻译:滑动窗口方法
Simultaneous Translation for Unsegmented Input: A Sliding Window Approach
Sukanta Sen, Ondřej Bojar, Barry Haddow
TL;DR提出一种基于滑动窗口的方法来翻译语音识别输出,实验结果表明比传统的 ASR 分段方法提高了 1.3-2.0 BLEU 分数,且减少了重新翻译的需要。
Abstract
In the cascaded approach to spoken language translation (SLT), the asr output
is typically punctuated and segmented into sentences before being passed to →
发现论文,激发创造
利用同步的流式 ASR 辅助的直接同声传译
本文提出一种新型的语音翻译范例,通过使用两个分离但同步的解码器,一个用于流式 ASR, 一个用于直接语音翻译,并通过 ASR 生成的中间结果指导直接语音翻译,实现了流畅度更高的翻译质量。
Jun, 2021
不要在语音到文本翻译中放弃固定窗口音频分割
本研究比较了不同方法对提高在线口译的鲁棒性的效果,并在离线和在线设置中测试了不同的分段策略,研究结果表明,在适当的条件下,简单的固定窗口音频分段可以表现出惊人的性能。
Oct, 2022
面向口语理解和同时语音翻译的分块流式 Transformer
本研究提出基于块状,流式 Transformer 的方法,通过流式处理和块状并行检索,在同时进行自然语言理解和语音翻译等多个语音处理任务中,实现实时处理并取得与离线模型相当甚至更高的性能表现,并通过引入自动语音识别中间层损失约束和跨语言编码方法等方式进一步提高分类性能和模型表现。
Apr, 2022
基于对齐分块的神经同声传译
提出了一种用于机器翻译的神经网络模型,其能够动态决定何时继续输入源文本或生成翻译文本,通过使用单向或双向编码器来处理实际语音和文本输入,使用词对齐方法生成分块训练数据,并在 IWSLT 2020 英 - 德任务上优于 wait-k 基线 2.6 到 3.7% BLEU 中的结果。
May, 2020
长篇同传口译的再翻译策略
本研究针对如何实现长篇演讲等语音内容的同声传译问题,采用重新翻译的方式进行同步翻译,并提出了优化应用工具以加强稳定性的方法。研究结果表明,这种方法不仅延迟极低,翻译结果也具有高质量,能够轻易地进行多语言翻译。
Dec, 2019
使用增强记忆变换器的流播同声传译
本文提出了一种针对实时应用场景的端到端增强记忆 Transformer 编码器,成功地应用于流式同声传译任务,可以处理大量连续输入,相较于单向掩码 Transformer 模型,具有更好的延迟和质量平衡。
Oct, 2020