Jul, 2024

性别之后的言语:语音科学和技术的下一步——跨性别女性的观点

TL;DR通过展示三个讲话者沿性别轴线调节声音的Versatile Voice Dataset (VVD),研究论证了当前基于性别的语音建模方法未能考虑到声道的灵活性,而利用公开可获得的说话者嵌入,性别分类系统对声音调节非常敏感,而说话者验证系统在声音变化较大时无法识别为同一位讲话者。研究提议以个体特质声音纹理,如音调、共鸣和重量,作为跳出分类和静态说话者认同的一条路径。