May, 2022
SAMU-XLSR:语义对齐的多模态话语级跨语言语音表示
SAMU-XLSR: Semantically-Aligned Multimodal Utterance-level Cross-Lingual
Speech Representation
TL;DR提出了SAMU-XLSR模型,基于语义对齐的多模态跨语言话语级别语音表示学习框架。通过将XLS-R模型和LaBSE模型组合,SAMU-XLSR模型可以提取高质量的多模态多语言话语语音特征,并可以实现跨语音和跨文字之间的相互转换。