使用自监督离散语音表示进行任意一对多序列到序列语音转换

Oct, 2020

使用自监督离散语音表示进行任意一对多序列到序列语音转换

Any-to-One Sequence-to-Sequence Voice Conversion using Self-Supervised Discrete Speech Representations

Wen-Chin Huang, Yi-Chiao Wu, Tomoki Hayashi, Tomoki Toda

TL;DR利用自监督VQ-Wav2vec表示的任意人说话到固定目标说话的任意对一语音转换问题的序列到序列框架，通过预处理和后处理方法，我们的模型可以具有更好的泛化能力，即使只有5分钟的数据。

Abstract

We present a novel approach to any-to-one (A2O) voice conversion (VC) in a sequence-to-sequence (seq2seq) framework. A2O VC aims to convert any speaker, including those unseen during training, to a fixed target speaker. We utilize vq-wav2vec (VQW2V), a discretized self-supervised speec