David Ericsson, Adam Östberg, Edvin Listo Zec, John Martinsson, Olof Mogren
TL;DR通过生成式对抗网络(GANs)的模型设计,训练一个 U 型卷积神经网络,用于隐藏声音数据中的敏感个人信息,例如性别等。
Abstract
As more and more data is collected in various settings across organizations,
companies, and countries, there has been an increase in the demand of user
privacy. Developing privacy preserving methods for data analytics is thus an
important area of research. In this work we present a mod
本文介绍了一种使用生成对抗网络(GAN)的统计参数语音合成方法,相比于传统的最小生成误差训练算法,该方法能够更自然地生成语音波形,并有效缓解了生成语音参数的平滑问题。我们还研究了不同 GAN 之间的差异,并发现最小化 Earth-Mover 距离的 Wasserstein GAN 可以最大程度地提高合成语音的质量。