BriefGPT.xyz
大模型
Ask
alpha
关键词
zero-shot voice conversion
搜索结果 - 3
SEF-VC:无说话人嵌入的零样本声音转换与交叉注意力
SEF-VC 是一种无需说话者嵌入的语音转换模型,通过强大的位置不可知的跨注意力机制从参考语音中学习和融入说话者音色,并以非自回归的方式从 HuBERT 语义标记中重建波形,提高了稳定性和语音转换性能。客观和主观评价证明了 SEF-VC 相
→
PDF
7 months ago
基于面部驱动的零射声音转换与基于记忆的面音对齐
一个基于面部图像的零样本语音转换任务中,提出了一种新颖的零样本面部语音转换方法,通过使用面部 - 语音对齐模块和混合监督策略来实现从一个源说话者到一个目标说话者的语音特征转换,并引入预训练的零样本语音转换模型,通过大量实验证明了该方法在零样
→
PDF
10 months ago
SLMGAN:利用语音语言模型表示的 GAN 进行无监督零样本语音转换
介绍了一种新的方法 SLMGAN,它利用 SLM(大规模预训练的语音语言模型)在生成对抗网络(GAN)框架中实现鉴别任务,特别是用于语音转换。通过在基于 mel 的鉴别器之上添加基于 SLM 的 WavLM 鉴别器,并结合新设计的 SLM
→
PDF
a year ago
Prev
Next