Jun, 2023

3D-Speaker:用于语音表示分离的大规模多设备、多距离和多方言语料库

TL;DR本研究介绍了一个大规模语音语料库 3D-Speaker,用于促进语音表征分离的研究。3D-Speaker 含有超过 10,000 个说话者的语音数据,包括不同距离、不同方言等多维度组合,适用于评估大型普适性语音模型的性能并尝试领域外学习和自监督学习方法。