Sep, 2022

Zero-shot 伪造语音进行说话人去识别

TL;DR提出了一种名为 DeID-VC 的系统,利用变分自编码器(VAE)生成伪人声以保护用户的语音隐私,可在发言者或话语层面分配独特的伪人声,并通过两个新的学习目标缩小了训练和推理之间的差距,实验结果表明与基线相比,DeID-VC 方法在可读性和去识别性方面都有显著改善。