Oct, 2022

动态隐变量感知器实现高效语音翻译

TL;DR该研究提出了一种使用感知器编码器和动态潜在访问训练的语音到文本转换技术,这种技术在 MuST-C 数据集上的三种语言中可以与 Transformer 基线模型的性能相匹配,并且可以在推理过程中灵活部署,适应多种计算预算,而不会导致显著降低翻译质量。