s2st | BriefGPT - AI 论文速递

关键词s2st

搜索结果 - 5

SimulTron: 设备本地实时语音翻译
SimulTron 是一种轻量级的直接 S2ST 模型，通过在移动设备上进行实时评估，优于 Translatotron 1 的性能，并在 MuST-C 数据集上实现了优越的 BLEU 得分和延迟，展示了在 Pixel 7 Pro 设备上同时
PDFa month ago
S2ST：基于隐变分扩散种子空间的图像到图象翻译
S2ST 是一个新颖的框架，用于在复杂的照片逼真图像中实现全局图像转换，如汽车场景的日夜或晴雨转换，通过利用由潜在扩散模型学习到的强大图像先验，S2ST 在改善保真度的同时保持了目标领域的外观，并超越了基于 GAN 的图像转换方法和基于扩散
PDF7 months ago
多语言语音翻译至多个目标语言
提出了一种支持多个目标语言的多语言语音翻译模型，采用语音单元和语音合成器进行多语言扩展，并在基准翻译测试集中表现优于双语模型。
PDFa year ago
PolyVoice: 语言模型用于语音翻译
我们提出了 PolyVoice，这是一个基于语言模型的语音 - 语音翻译（S2ST）系统，利用离散化语音单元实现对未书写语言的翻译。在语音合成方面，我们采用现有的 VALL-E X 方法构建基于单元的音频语言模型来保留原始语音的音色特征和语
PDFa year ago
UnitY：使用离散单元进行两阶段直接语音翻译
本文提出了一种名为 UnitY 的新型两遍直接 S2ST 架构，通过子词预测、先进的两遍解码器架构设计和搜索策略以及更好的训练规则等技术实现模型性能的提升，其在多个基准数据集上表现出比单遍语音转换模型高 2.5-4.2 ASR-BLEU 分
PDF2 years ago