ESPnet-ST 是一个新的项目,它是一个专门为在单一框架中快速开发语音到语音翻译系统而设计的,它集成或重新实现了自动语音识别、机器翻译和文本到语音功能。
Apr, 2020
ESPnet-ST-v2 是一个开源工具包,它支持离线语音到文本翻译、同声传译以及离线语音到语音翻译等多种任务,提供了包括转录器、混合 CTC/attention、多解码器、时间同步分块 CTC/attention、Translatotron 模型和直接离散单元模型等最先进的架构。
Apr, 2023
XNMT 是一款开源的、基于模块化代码设计的神经机器翻译工具,可应用于机器翻译、语音识别和多任务翻译 / 解析等领域。
Mar, 2018
该研究描述了一个优先考虑效率、模块化和可扩展性的神经机器翻译开源工具集,用于支持对模型架构、特征表示和源模态进行 NMT 研究,同时保持竞争性能和合理的训练要求。
Jan, 2017
本论文讨论了 USTC-NEL 系统在 2018 年 IWSLT 评估的语音翻译任务中的应用,使用了传统的管道系统,包含三个模块:语音识别、后处理和机器翻译。我们训练了一组混合 - HMM 模型进行语音识别,并使用语音识别输出风格的文本作为输入来训练基于 transformer 的神经机器翻译模型。在 IWSLT 2018 任务上的实验表明,相较于 KIT 的基线系统,我们的系统实现了 14.9 的 BLEU 改善。
Dec, 2018
OpenNMT 是一种面向 NMT 研究的开源工具包,主要关注效率、可扩展性和可组合性,并且在多个生产 MT 系统中得到了应用。
May, 2018
提出了一种基于 Cross Speech-Text(XSTNet)网络的用于语音翻译的端到端模型,采用自监督预训练子网络作为音频编码器、多任务训练目标以及渐进式训练策略,并在 MuST-C En-X 和 LibriSpeech En-Fr 数据集上取得了最新的最佳效果,平均 BLEU 值为 28.8,优于之前的最佳方法 3.2 BLEU。
Apr, 2021
本文提出了一种简单且有效的多语言端到端语音翻译框架,并证明了其在自动语音识别、机器翻译、一对多翻译以及多对多翻译中的有效性以及相对于双语端到端语音翻译的优势。
Oct, 2019
本研究旨在分享我们在神经机器翻译领域的专业知识,创造出竞争力强且适用于不同用例的翻译引擎,在实际生产流程中实现特定领域的高效翻译。我们提供了一种同时发布多种语言在线演示程序的方法,并探索了不同的实用选项、网络架构和评估方法等。
Oct, 2016
本文介绍了如何将神经转录器引入流式端到端语音翻译(ST)中,提出了基于注意力池化的 Transformer transducer(TT)模型以及在多语言 ST 中的应用,结果表明 TT 模型不仅显著减少了推理时间,而且在英德翻译上优于基于 ASR 和 MT 的非流式级联 ST。
Apr, 2022