Apr, 2024

声音过渡:一种不二元的声音性别预测系统,用于评估跨性别者的声音变化

TL;DR描述通过连续的声音女性化百分比(VFP)来描述声音的软件系统,旨在帮助跨性别者在声音转变过程中以及支持他们的声音治疗师。通过记录了41名法国的非二元性别和跨性别说话者的语料库,并通过感知评估让57名参与者估计了每个声音的VFP。在外部性别平衡数据上训练了二元性别分类模型,并在重叠窗口上使用,得到了平均性别预测估计值,该值被校准以预测VFP,并且比基于$F_0$或声道长度的模型的准确性更高。训练数据的说话风格和DNN结构影响了VFP的估计。模型的准确性受到说话者年龄的影响,突显了在构建适当的文化概念的统计表达时,风格、年龄和性别的概念是二元的还是非二元的的重要性。