分析数据不纯度对精神障碍检测性能的影响
此研究评估了使用机器学习和自然语言处理技术来检测抑郁症的方法,针对数据清理、模型选择等方面进行了案例研究,并在具体实验中使用 Distress Analysis Interview Corpus - Wizard-of-Oz(DAIC-WOZ)数据集构建出准确率约为 84% 的模型,明显高于现有文献中通过 SVM 模型得到的 72% 的准确率。
Apr, 2024
本文探索使用社交媒体数据预测多种心理健康状况的自动化检测方法,根据诸如句法复杂性、词汇复杂性和多样性、情感等语言特征,基于混合和集成模型的比较后发现多分类模型在自动化心理健康检测研究中更加准确有效。
Dec, 2022
本论文介绍了 PsySym,它是第一个注释的多个精神障碍症状识别语料库,采用 38 个症状类别的知识图和多样性和质量的新注释框架。实验表明,PsySym 辅助的症状识别可以胜过强大的纯文本基线。症状预测提供了令人信服的精神疾病诊断解释,具有进一步应用潜力。
May, 2022
本研究比较了基于语音和文本特征的二元分类和多类分类模型在区分多种神经精神障碍时的表现,结果显示联合模型表现更佳,同时提出今后应该关注更具代表性的跨诊断数据集以及精细化的临床特征。
Jan, 2023
本研究通过对社交媒体发帖进行分析,开发了一个金标准数据集,将人的抑郁水平分为 ' 未抑郁 '、' 中度抑郁 ' 和' 严重抑郁 ' 三种级别,并采用数据增强技术和机器学习算法,其中 Word2Vec 向量化技术和随机森林分类器在数据增强的模型中表现最佳,准确度和 F1 值均为 0.877 。
Feb, 2022
本文研究利用数据增强技术对社交媒体用户生成文本进行分类的效果,发现 Easy Data Augmentation,conditional BERT 和 Back Translation 等技术对于分类器性能的提高有潜力,这对于存在缺乏标记数据和倫理清晰的社会媒体平台上的自动生成的文本的心理健康分类是有意义的。
Dec, 2021
通过分析社交媒体平台上人们的发帖和讨论,借助自然语言处理技术,本研究提出一种新颖的语义特征预处理技术,通过弱分类器减少特征稀疏性,采用模量循环实现自适应特征维度,深度挖掘和扩展上下文中的特征,训练一个机器学习模型来预测和分类精神障碍,通过 Reddit 精神健康数据集 2022 对焦虑、边缘型人格障碍和双相情感障碍等病症进行研究,解决了数据稀疏性挑战,显著提高了性能,为心理健康预测与监测提供创新解决方案。
Nov, 2023
通过 Reddit 上用户的情感状态及其转换,提出了一种采用被动式(即自动不受触发)诊断的模型,可以帮助提醒有精神疾病的患者尽快寻求治疗,相比文本内容模型更好地泛化在不同主题和时间的情境中。
Jan, 2022
该研究使用机器学习和人工智能方法通过 Reddit 平台分析患有抑郁症、焦虑症、躁郁症、多动症和创伤后应激障碍的人群,从而为公共健康系统提供自动化检测工具,及时了解需要紧急救助的人员情况,使精神疾病患者更容易获得帮助。
Jul, 2022
研究了使用社交媒体的语言特征来检测心理健康问题,并提出了一种能够有效利用领域知识、可被应用于其他心理障碍以及能够提供可解释检测结果的模型。
Jun, 2023