BriefGPT.xyz
Ask
alpha
关键词
fastspeech2
搜索结果 - 4
SALTTS:利用自我监督的语音表示改进语音合成
通过结合 Self-Supervised Learning 的表示形式,使用 encoder 层次重建其表示结果并应用于数据增强技术,提高 FastSpeech2 的语音合成质量。
PDF
a year ago
EmoSpeech:引领 FastSpeech2 朝向情感文本朗读技术的方向
本文探讨了在 FastSpeech2 的基础上如何通过更改结构实现情感语音的合成,并且在自动和人体评估中, 创造了 EmoSpeech 模型,该模型的 MOS 得分和情感识别准确性均超过了现有模型。
PDF
a year ago
重音文本转语音的明确强度掌控
本文提出了一种直观明确的口音强度控制方案,首先从 L1 语音识别模型中提取后验概率,称为 “发音好坏度”,量化有重音的语音的音素重音程度,然后设计了一种基于 FastSpeech2 的 TTS 模型 Ai-TTS,在语音生成过程中考虑口音强
→
PDF
2 years ago
基于参考模型的半监督学习在低资源 TTS 中的应用
本论文提出了一种半监督学习的神经语音合成方法,该方法专注于在标记目标数据量有限的情况下实现性能相对较好的 TTS,并能解决原来的自回归模型中出现的曝光偏差问题,实验结果表明,该方法能够在目标数据量有限的情况下,显著提高测试数据的语音合成自然
→
PDF
2 years ago
Prev
Next