社交媒体中的心理健康分类数据增强
本研究提出了 UATTA-EB 方法,利用深度学习模型分析 Reddit 用户在网络平台上的非结构化数据,精准识别和分类六种心理疾病(抑郁症、焦虑症、双相障碍、注意力缺陷多动障碍(ADHD)、创伤后应激障碍(PTSD)和无疾病),解决了模型可靠性和过度自信的问题,为精准诊断心理疾病提供了新的方法。
Apr, 2023
本文探索使用社交媒体数据预测多种心理健康状况的自动化检测方法,根据诸如句法复杂性、词汇复杂性和多样性、情感等语言特征,基于混合和集成模型的比较后发现多分类模型在自动化心理健康检测研究中更加准确有效。
Dec, 2022
本研究使用 transformer 模型对 CAMS 数据集进行预训练的迁移学习,改善了现有分类器的效率,准确性取得了提升,证明了在社交媒体上对于心理健康分析中的因果关系的识别是必要的。
Jan, 2023
研究了使用社交媒体的语言特征来检测心理健康问题,并提出了一种能够有效利用领域知识、可被应用于其他心理障碍以及能够提供可解释检测结果的模型。
Jun, 2023
本文提出了一种基于生成式 NLP 模型的简单而有效的数据增强方法,称为 prompt-based,应用于 Wellness Dimensions 的分类预筛选任务,该方法不仅优于 Easy-Data Augmentation 和 Backtranslation 等基线方法,而且在 F 分数和 Matthew 的相关系数方面均实现了明显的改进。
Jun, 2023
通过深度学习模型检测社交媒体用户的心理状况,可以更好地理解疾病并提供早期发现的手段。基于分层注意力网络的二元分类任务预测用户是否患有九种不同疾病中的一种,在四种疾病中表现出比先前设定的基准更高的性能,并通过检查模型的单词级注意权重分析分类相关的短语的限制。
Mar, 2020
本研究使用基于 Transformer 架构的 RoBERTa 模型,对社交媒体上的用户数据进行分析,以检测和分类抑郁症、焦虑症、双相情感障碍、注意力缺陷多动障碍和创伤后应激障碍等五种主要的心理疾病,从而促进公共健康系统的自动化诊断和分类流程。
Nov, 2020
情感识别在文本中,识别诸如喜悦或愤怒之类的情感,是 NLP 中的一个具有挑战性的问题,其中一个挑战是缺乏已注释有情感的可用数据集。本研究研究了数据增强技术对小规模不平衡数据集的影响,并且证实使用增强数据训练分类器模型可以显著改进情感识别性能。
Oct, 2023
通过分析社交媒体平台上人们的发帖和讨论,借助自然语言处理技术,本研究提出一种新颖的语义特征预处理技术,通过弱分类器减少特征稀疏性,采用模量循环实现自适应特征维度,深度挖掘和扩展上下文中的特征,训练一个机器学习模型来预测和分类精神障碍,通过 Reddit 精神健康数据集 2022 对焦虑、边缘型人格障碍和双相情感障碍等病症进行研究,解决了数据稀疏性挑战,显著提高了性能,为心理健康预测与监测提供创新解决方案。
Nov, 2023
本研究探索了数据增强技术对文字分类的影响,使用多种数据增强技术,包括过采样、易用数据增强、反向翻译、灰度缩放以及一种少样本学习的方法 PTE。结果表明,数据增强技术对模型性能只有轻微且不一致的改进,少数同义词替换可以提高模型性能,灰度缩放需要进一步研究,PTE 的表现优于监督学习,尤其是在类别容易分离的情况下。
Mar, 2023