self-supervised learning (SSL) has been investigated to generate
task-agnostic representations across various domains. However, such
investigation has not been conducted for detecting multiple mental disorders.
T
本文提出利用具有自我监督学习预训练的基础模型来处理语音自动抑郁症检测中的训练数据稀疏性,并从自动语音识别和情感识别向抑郁症检测进行知识传递,结果表明使用 ASR 语音隐含层表示和 ASR 文本信息同时进行微调可以实现类似的 SDD 性能,最终通过整合多个基础模型的表示达到了基于真实 ASR 的 DAIC-WOZ 数据集上最先进的 SDD 结果。