Jul, 2023

ContextSpeech:适用于段落阅读的表现力强、有效率的文本转语音技术

TL;DR该论文提出了一种轻量级而有效的 TTS 系统 ContextSpeech,采用记忆缓存的复现机制和分层结构的文本语义,以及线性化的自注意力机制来增强全局文本和语音语境,并在长篇阅读中显着提高了语音质量和语调表现力。