Nov, 2023

远场发言人验证的语音感知说话人嵌入

TL;DR提出了一种联合训练语音识别和说话人识别 (JTSS) 框架,以利用语音中的音素内容来进行远场说话人验证,结果表明在远场环境下利用音素信息是学习强健说话人表示的有效方法。