May, 2023

低资源场景下用于栋笃笑表演的语音合成技术

TL;DR本研究构建了一个新的数据集,开发了 ComedicSpeech—— 适用于低资源场景下的单口喜剧合成的 TTS 系统,其灵活提取了韵律、个人节奏和填充词等个性特征,并展示了仅使用每位喜剧演员十分钟训练数据的情况下,比基线模型获得更好的表现。