Dec, 2022

UnitY:使用离散单元进行两阶段直接语音翻译

TL;DR本文提出了一种名为 UnitY 的新型两遍直接 S2ST 架构,通过子词预测、先进的两遍解码器架构设计和搜索策略以及更好的训练规则等技术实现模型性能的提升,其在多个基准数据集上表现出比单遍语音转换模型高 2.5-4.2 ASR-BLEU 分数且同时具有 2.83 倍的解码速度提速。