Oct, 2023

如何构建多性别竞争性语音翻译模型以控制说话者性别翻译

TL;DR通过将说话者的性别元数据合并到单个 “多性别” 神经语音转换模型中,可以避免性别偏见并提高性别准确性(女性形式可提高 12.9),相比专门的性别模型,该模型训练自零效果更好,而基于现有频培训模型的微调则不具有竞争力。