关键词multilingual speech-to-text translation
搜索结果 - 2
- CoLLD: 对比层间蒸馏用于压缩多语言预训练语音编码器
大规模无监督预训练语音编码器优于传统方法在语音识别和翻译任务中。然而,由于开发这些大型模型的高成本,构建新的编码器用于新任务并将其部署到设备应用上是不可行的。因此,先前的研究提出了模型压缩方法来解决该问题,但这些方法主要关注较小的模型和较不 - 自动语音翻译的跨语言转移学习改进
本论文旨在通过语义知识蒸馏来改进多语言语音转文本翻译中的跨语言迁移学习。通过使用 SAMU-XLS-R 来初始化编码器,我们在 CoVoST-2 和 Europarl 语音转文本数据集上实现了比基线模型更好的交叉语言任务知识传输,其中平均提