Jun, 2024

非流畅语音 -- 单说者会话语音数据集与言语表情

TL;DR研究表明,非语言语音如笑声、叹息、结巴等虽不直接提供词汇含义,但其提供的语义和语用上下文对理解其间的讽刺等有重要作用。本研究提出了 DisfluencySpeech,一个以真实对话模拟形式重现 Switchboard-1 电话语音语料库中出色演讲的英语语音数据集,为开发能够预测性地从文本中合成非语言语音的 TTS 模型提供了帮助。