BriefGPT.xyz
Ask
alpha
关键词
text-to-speech (tts)
搜索结果 - 3
MakeSinger: 一种用于数据高效的半监督训练方法的歌声合成,通过无分类器扩散引导
通过无分类器扩散引导的 MakeSinger 半监督训练方法,提高合成的歌声质量,并展示即使在无歌声数据的情况下,通过训练文字转语音 (TTS) 数据的模型仍可以合成 TTS 说话者的歌声。
PDF
a month ago
通过自监督表示增强基于 LLM 的语音生成系统的稳定性
在这项研究中,我们介绍了一种新的自监督语音转换(VC)架构,它可以用来学习将瞬时特征,如内容,与静态特征(如说话者 ID 或录音条件)分开进行编码,从而创建说话者解耦的表示。结果表明,训练过以说话者解耦的自监督表示的 Large Langu
→
PDF
5 months ago
利用正规化流生成新的语音
通过归一化流(normalizing flows)实现从训练时未见过的声音身份合成逼真、自然的合成语音的研究中,我们创建了一种文本转语音(TTS)和语音转换(VC)的方法,并使用客观和主观指标来评估技术在零样本和新声音语音合成任务中的性能,
→
PDF
6 months ago
Prev
Next