May, 2022

SAMU-XLSR:语义对齐的多模态话语级跨语言语音表示

TL;DR提出了 SAMU-XLSR 模型,基于语义对齐的多模态跨语言话语级别语音表示学习框架。通过将 XLS-R 模型和 LaBSE 模型组合,SAMU-XLSR 模型可以提取高质量的多模态多语言话语语音特征,并可以实现跨语音和跨文字之间的相互转换。