Jun, 2024

WavRx:一种疾病不可知、通用和隐私保护的语音健康诊断模型

TL;DR提出了一种能够捕捉通用语音表示中呼吸与表达动态的语音健康诊断模型 WavRx,该模型在六个病理语音数据集上的领域内和领域间实验表明 WavRx 是一种新的最先进的健康诊断模型,并且在没有额外指导的情况下,WavRx 健康嵌入中包含的说话者身份信息得到显著降低,同时通过对模型的深入分析提供了其改进的泛化能力和隐私保护能力的生理解释。