关键词accent intensity control
搜索结果 - 2
- 重音文本转语音的明确强度掌控
本文提出了一种直观明确的口音强度控制方案,首先从 L1 语音识别模型中提取后验概率,称为 “发音好坏度”,量化有重音的语音的音素重音程度,然后设计了一种基于 FastSpeech2 的 TTS 模型 Ai-TTS,在语音生成过程中考虑口音强 - 可控口音的语音合成
该论文提出了一种神经网络 TTS 架构,可在推理期间控制重音和重音强度,并以三种新机制实现,即使用方案控制因子建模复杂的重音变异,量化重音强度的强调强度建模策略以及一致性约束模块。实验为该模型的重音渲染和强度控制性能提供了证明,并证明其是有