Aug, 2020

用于序列到序列语音转换的预训练技术

TL;DR本文介绍一种转换语音的新方法,提出了在应用 Sequence-to-sequence (seq2seq) voice conversion (VC) 模型之前,将其他语音处理任务如文本到语音 (TTS) 和自动语音识别 (ASR) 应用到模型中来传递知识,从而生成高质量,高准确性,高还原度的语音,证明了 transformer 模型在智能,自然和相似性方面优于 RNN 模型。