BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-speaker tts
搜索结果 - 3
Ada-TTA:自适应高质量文本到语音头像合成
本文提出 Adaptive Text-to-Talking Avatar(Ada-TTA),该方法在语音识别的背景下,设计了通用的零样本多扬声器 TTS 模型,并采用神经渲染技术来实现逼真的音频驱动的说话面部视频生成,实现了身份保护言语和逼
→
PDF
a year ago
Adapitch: 基于音调分离无转录数据的多说话人文本到语音自适应
本篇论文提出 Adapitch 方法,使用无字幕数据对受监督模型进行自适应,并设计了两个自监督模块对文本编码器和 Mel 解码器进行训练,以增强文本和 Mel 的表征能力,同时使用内容分解的有条件 TTS 模块更好地处理合成音中的韵律信息。
→
PDF
2 years ago
MultiSpeech: 基于 Transformer 的多说话人文本转语音
本文提出了一种名为 MultiSpeech 的高质量多说话人变压器语音合成系统,通过几个特殊设计的组件 / 技术改善了文本到语音的对齐,并在多个数据集上展示了其效果。
PDF
4 years ago
Prev
Next