融合基于文本和基于图形的特征用于从语音中检测心理健康疾病
本文介绍了一种多模态特征提取和决策层融合方法用于通过机器学习算法自动检测抑郁症,并使用支持向量机和神经网络对特征进行分类,在音频特征和视频特征上比验证数据集提供的基线分别提高了 17%和 24.5%。
Sep, 2017
通过对不同交互场景中的语音信号进行研究,包括精神科面谈、聊天机器人对话和文字朗读,本研究探究了语音信号在基于人工智能的抑郁症筛查中的实用性。利用从每个参与者的分割录音中提取的声学和深度语音特征,使用神经网络或支持向量机进行分类,并通过聚合的音频片段结果确定最终评估。分析结果表明,语音在抑郁症筛查中是一个关键的标志物,人机交互的效果与临床面谈相匹配,甚至优于阅读任务。片段时长和数量对模型性能有显著影响,而深度语音特征在表现上明显优于传统声学特征。
Jun, 2024
提出了一种基于多模态语音和文本表达的关注机制用于预测抑郁症,使用 DAIC-WOZ 数据集训练所提出的模型,分别在音频、文本和多模态情况下进行了实验,并取得了较好的预测效果。
Feb, 2022
本研究比较了基于语音和文本特征的二元分类和多类分类模型在区分多种神经精神障碍时的表现,结果显示联合模型表现更佳,同时提出今后应该关注更具代表性的跨诊断数据集以及精细化的临床特征。
Jan, 2023
本研究旨在探讨通过使用多模态融合模型,利用患者声音、视频、文本等特征预测临床评估中的抑郁症状,PHQ-8,该模型在训练 AVEC 2017 数据集时表现优于每个单一模态的预测模型,并超越数据集的基线水平。
Nov, 2017
研究表明,语言使用与抑郁症相关,但需要大规模验证。本研究使用 Whispter 工具和 BERTopic 模型从 265 名参与者的 3919 个智能手机采集的语音记录中鉴定出 29 个话题。其中六个话题中 PHQ-8 中值大于等于 10 被视为抑郁风险话题:无期望、睡眠、心理疗法、剪发、学习和课程作业。我们比较了识别到的话题之间的行为(通过可穿戴设备)和语言特征,揭示了话题的产生及其与抑郁症的关联。同时,通过调查话题转变与时间内抑郁症严重程度的变化之间的关系,证明了长期监测语言使用的重要性。此外,我们还在一个类似较小的数据集上测试了 BERTopic 模型(57 名参与者的 356 个语音记录),获得了一些一致的结果。总结起来,我们的发现表明特定的语音话题可能会指示抑郁症的严重程度。所呈现的数据驱动工作流提供了一种在真实环境中收集和分析大规模语音数据的实用方法,可用于数字健康研究。
Aug, 2023
通过重分配数据和使用原始音频特征等 Fair Machine Learning 的方法,我们可以解决 Distress Analysis Interview Corpus - Wizard of Oz (DAIC-WOZ) 数据集中的性别偏见问题,从而解决数据偏见对抑郁症检测性能的影响。
Oct, 2020
本文介绍了一种基于机器学习的方法,在自动检测抑郁症状方面,使用 3D 面部表情和口语,取得了很好的效果,对于检测重度抑郁症,模型表现出 83.3%敏感性和 82.6%特异性。该技术结合语音识别、计算机视觉和自然语言处理,可用于帮助心理健康患者和从业人员在全球范围内普及低成本的心理健康护理。
Nov, 2018
此研究评估了使用机器学习和自然语言处理技术来检测抑郁症的方法,针对数据清理、模型选择等方面进行了案例研究,并在具体实验中使用 Distress Analysis Interview Corpus - Wizard-of-Oz(DAIC-WOZ)数据集构建出准确率约为 84% 的模型,明显高于现有文献中通过 SVM 模型得到的 72% 的准确率。
Apr, 2024
本文介绍了一个新型的多级注意力网络用于多模式抑郁症预测,包括来自音频、视频和文本模式的特征融合,其在选择每种模式内最具影响力的特征进行决策时通过多级注意力加固了整体学习,实验中表现优于现有基线 17.52% 的均方根误差。
Sep, 2019