ICLRJan, 2020

基于样本自编码器的无监督音频视觉合成

TL;DR该论文提出了一种无监督方法,可以将任何个人的输入语音转换为无限数量的输出扬声器的音频可视化流,并使用先例自编码器学习特定目标样本语音的声音、风格韵律和视觉外观,它可以很容易地扩展到任意数量的扬声器和风格,而无需对输入扬声器进行任何训练数据。