BriefGPT.xyz
Ask
alpha
关键词
speaker encoder
搜索结果 - 2
ALO-VC:任意低延迟单次语音转换
本文提出了基于语音后验图的非并行低延迟单次语音转换方法 ALO-VC,采用预训练说话人编码器、语调预测器和位置编码器结合的混合信号处理和机器学习管道,提供两个系统版本,均可在单个 CPU 核心上部署并达到与非因果基线系统相当的性能。
PDF
a year ago
通过对抗性说话者适应实现发音不清语音重建中说话者身份的保留
提出了一种基于 adversarial speaker adaptation 的多任务学习策略,主要任务是 fine-tune 演讲者编码器以有效捕捉身份相关的信息,并通过应用对抗性训练来规范重建语音的分布,以避免引入异常发言模式。结果表明
→
PDF
2 years ago
Prev
Next