Nov, 2022

快速连接主义说话人适应

TL;DR该研究介绍了一种名为 SVCnet 的系统,使用专门针对每种语音声音的编码神经网络生成小维度的声学变异模型,并进一步将这些模型组合成总体的声音变异模型。该系统可以用于适应识别新说话人的功能,其中将 SVCnet 与 MS-TDNN 识别器相结合的系统也被详细介绍。