Jul, 2023

MASR:元数据感知的语音表示

TL;DR该论文提出了一种元数据感知的语音表示学习框架(MASR),通过使用多个外部知识源来增强元数据信息的利用,以实现在语言识别、语音识别、说话人和情感识别等下游任务中较其他基准方法明显的性能提升,并对语言识别任务进行了详细分析,以阐明所提出的损失函数如何使表示能够区分密切相关的语言。