Dec, 2019
基于 Transformer 的序列到序列语音转换网络:利用文本到语音预训练
Voice Transformer Network: Sequence-to-Sequence Voice Conversion Using Transformer with Text-to-Speech Pretraining
Wen-Chin Huang, Tomoki Hayashi, Yi-Chiao Wu, Hirokazu Kameoka, Tomoki Toda
TL;DR本文提出了一种基于 Transformer 架构和文本到语音预训练的新颖的序列到序列语音转换模型,通过预训练的方式,向转换模型传递语音相关的知识,实现数据高效训练,提高语音转换的清晰度、自然度和相似度。