- SimulSeamless:FBK 参加 IWSLT 2024 同传
FBK 在 IWSLT 2024 的同时翻译评估竞演中通过提出的 SimulSeamless 方法参与了语音到文本翻译的子任务,使用 AlignAtt 和 SeamlessM4T 结合的中等配置,实现了无需重新训练或调整底层模型的跨注意力 - 同时屏蔽,不是提示优化:同传中微调语言模型的范式转变
利用一种名为 SimulMask 的新模式,通过在 Fine-tuning 期间通过屏蔽注意力连接来建模即时翻译,成功解决了一系列问题,从而使大语言模型在同时翻译任务中取得了显著提升的翻译质量,并减少了计算成本。
- Simul-LLM:一个探索使用大型语言模型进行高质量同时翻译的框架
大型语言模型在神经机器翻译中的应用被广泛研究,本文关注于将大型语言模型 fine-tuning 用于较困难的同时翻译任务,验证了经典方法在大型语言模型上的有效性,探索了将用于机器翻译的大型语言模型调整为同时翻译任务的适应方法,并引入 Sim - 平均令牌延迟:同时翻译的时延度量
同时翻译是一种在输入语音片段结束之前开始的任务。我们提出了一种用于同时翻译的新颖延迟评估指标 —— 平均令牌延迟 (ATD),该指标侧重于部分翻译的持续时间。通过基于耳 - 声跨度 (EVS) 进行用户端延迟模拟的分析,我们证明了该指标的有 - FBK@IWSLT2023 的直接模型对于同步翻译和自动字幕
该论文描述了 FBK 参与 IWSLT 2023 评估活动中的同时翻译和自动字幕轨道。我们的提交重点是使用直接架构来执行这两项任务:对于同时翻译,我们利用了离线训练模型已经获得的知识,并直接应用策略获得实时推理结果;对于字幕,我们对直接 S - 学习何时发声:离线模型下同时语音翻译中的延迟和质量权衡
本文提出了一种面向实际应用场景的实时语音翻译系统 SimulS2ST,支持 57 种语言对英语的翻译,具备实时调节输出延迟的功能,能够非常快速地进行语音翻译。
- 平均标记延迟:一种用于同时翻译的延迟度量
本研究提出了一种基于平均标记延迟的评估指标(ATD),旨在更好地考虑同声传译中翻译结束时间对延迟的影响,并通过模拟实验和同声传译实验来探讨 ATD 的优势和与平均滞后度之间的差异。
- EMNLP基于信息传输的同声传译政策
本文提出一种称为基于信息传输的同传(ITST)的方法,将翻译看作是从源到目标的信息传输,并据此确定翻译策略。实验证明,该方法在文本到文本和语音到文本方面表现优越,达到了最先进的性能。
- 数据驱动的自适应同时机器翻译
本文提出一种用于自适应 SimulMT 训练的有效方案,通过向训练语料库中添加自适应前缀对前缀的语句,来缓解 Wait-K 策略的两个主要限制,实验证明该方法在翻译质量和延迟方面优于所有强基准线。
- 面向口语理解和同时语音翻译的分块流式 Transformer
本研究提出基于块状,流式 Transformer 的方法,通过流式处理和块状并行检索,在同时进行自然语言理解和语音翻译等多个语音处理任务中,实现实时处理并取得与离线模型相当甚至更高的性能表现,并通过引入自动语音识别中间层损失约束和跨语言编码 - USTC-NELSLIP 在 IWSLT 2021 的同声传译系统
本文介绍了中国科技大学 - 智能语音处理研究组在 IWSLT2021 同声传译(Simultaneous Speech Translation)比赛中的参赛作品。我们提出了一种新颖的同声翻译模型 Cross Attention Augmen - EMNLP同时多支点神经机器翻译
该论文以多种语言为中介语,提出利用多种语言进行平行翻译的思路,应用于实现实时语音翻译并进一步改进了 BLEU 指数。
- 端到端同时语音翻译解码策略的实证研究
本文提出了一种针对端到端同时语音翻译的解码策略,利用线下训练的端到端模型,并对两种语言对进行了实证研究,探讨了不同的输出令牌粒度以及在不同延迟情况下控制 BLEU/Average Lagging 平衡的方法,效果良好。
- AAAI基于未来引导的增量变换器进行同声翻译
提出了增量 Transformer 结合平均嵌入层(AEL)加快计算速度、传统 Transformer 作为增量 Transformer 的 teacher 通过知识蒸馏在模型中加入未来信息进行未来导向训练的方法,在汉英和德英同时翻译任务中 - 从 SimulMT 到 SimulST: 将同时翻译文本转换为端到端同时翻译语音
本文调查了如何将同步文本翻译方法与同时语音翻译相结合,并通过引入预决定模块来适应于端到端的同时语音翻译。同时,对将固定和灵活的预决策与固定和灵活的策略相结合的延迟质量权衡进行了详细分析。作者还设计了一种新的计算感知的延迟度量方法,该方法从平 - 利用伪参考文本并减少重新排序来提高同声传译质量
提出了一种将现有的全句子语料库改写为同时翻译风格的新方法,用生成的伪参考文本增强机器翻译系统,在中英文和日英文同时翻译任务中获得高达 2.7 BLEU 的显著改善。
- EMNLP自适应训练的流畅低延迟语音同传翻译
提出了一种名为 Self-Adaptive Translation (SAT) 的方法,实现同时语音翻译。该方法通过灵活调整翻译的长度,以适应不同的源语音速率,从而在保持近似的翻译质量的前提下,显著降低了延迟,生成了更流畅自然的目标语音。
- SimulEval:一款用于同时翻译评估的工具包
SimulEval 是一个易于使用、面向同时文本和语音翻译的通用评估工具包,通过客户端执行自定义策略实现同时解码,自动执行同时解码并收集几个流行的延迟度量。
- ACL共同成长:利用 n-Best 多检查点机器翻译模型来建模人类语言学习
该论文描述了使用一个多检查点的模型来生成具有不同流畅程度的翻译序列的方法,并展示了其在 Duolingo 共享任务中的性能优于基线 Amazon 翻译系统。
- ACL通过微调 Transformer 模型实现同时释义和翻译
本论文介绍了使用预训练模型结合 Transformer 架构和过采样策略,对同时翻译和改写语言教育的共享任务的第三种方法。该系统在匈牙利语和葡萄牙语方面表现优异,比基准系统改进了 27% 和 33% 的宏平均 F1 得分。