Feb, 2022

通过对抗性说话者适应实现发音不清语音重建中说话者身份的保留

TL;DR提出了一种基于 adversarial speaker adaptation 的多任务学习策略,主要任务是 fine-tune 演讲者编码器以有效捕捉身份相关的信息,并通过应用对抗性训练来规范重建语音的分布,以避免引入异常发言模式。结果表明,该方法可在保持语音自然度的同时实现增强的演讲者相似性。