Oct, 2023

通过感知的声音特质实现说话人身份的可解释表示

TL;DR通过添加性别感知语音特征到 Consensus Auditory-Perceptual Evaluation of Voice(声音感知评估协议)中,基于感知声音特征的方法提供了一种成人声音性格的感知潜在空间,作为高层次人口统计学信息和低层次声学、物理或学习表示之间的中间抽象。与先前的观点相反,我们证明这些感知声音特征可以被非专家集体听到,并且进一步证明了以感知声音特征为基础的表示中所编码的信息可以通过多种语音表示进行预测。