Jun, 2024
应用 ASV 进行语音识别:TTS 模型中 VC 和持续性预测改进的应用
Application of ASV for Voice Identification after VC and Duration Predictor Improvement in TTS Models
Borodin Kirill Nikolayevich, Kudryavtsev Vasiliy Dmitrievich, Mkrtchian Grach Maratovich, Gorodnichev Mikhail Genadievich, Korzh Dmitrii Sergeevich
TL;DR该论文介绍了一种自动发言人验证系统,以从目标发言人的音频中提取嵌入信息,用于获取他的声音的重要特征,如音高、能量和音素的持续时间,并在多声音 TTS 流水线中使用该信息。