May, 2023

在低资源条件下调查预训练音频编码器

TL;DR使用三种最先进的语音编码器,Wav2vec2、WavLM 和 Whisper,对于 7 个语音理解和生成任务在低资源环境下进行了全面的实验,研究结果表明,Whisper 编码器在执行与内容相关的任务时具有最好的性能和收敛速度。