May, 2023

基于语音的自监督表示在抑郁症检测中的应用

TL;DR本文提出利用具有自我监督学习预训练的基础模型来处理语音自动抑郁症检测中的训练数据稀疏性,并从自动语音识别和情感识别向抑郁症检测进行知识传递,结果表明使用 ASR 语音隐含层表示和 ASR 文本信息同时进行微调可以实现类似的 SDD 性能,最终通过整合多个基础模型的表示达到了基于真实 ASR 的 DAIC-WOZ 数据集上最先进的 SDD 结果。