社交媒体中的心理健康分类数据增强

Dec, 2021

社交媒体中的心理健康分类数据增强

Data Augmentation for Mental Health Classification on Social Media

Gunjan Ansari, Muskan Garg, Chandni Saxena

TL;DR本文研究利用数据增强技术对社交媒体用户生成文本进行分类的效果，发现 Easy Data Augmentation，conditional BERT 和 Back Translation 等技术对于分类器性能的提高有潜力，这对于存在缺乏标记数据和倫理清晰的社会媒体平台上的自动生成的文本的心理健康分类是有意义的。

Abstract

The mental disorder of online users is determined using social media posts. The major challenge in this domain is to avail the ethical clearance for using the user generated text on →

mental disorder social media data augmentation classification machine learning

发现论文，激发创造

UATTA-EB：基于 BERT 的不确定性感知测试时间增强集成模型，用于社交媒体帖子中的常见心理疾病分类

本研究提出了 UATTA-EB 方法，利用深度学习模型分析 Reddit 用户在网络平台上的非结构化数据，精准识别和分类六种心理疾病（抑郁症、焦虑症、双相障碍、注意力缺陷多动障碍（ADHD）、创伤后应激障碍（PTSD）和无疾病），解决了模型可靠性和过度自信的问题，为精准诊断心理疾病提供了新的方法。

Apr, 2023

探索基于混合和集成模型的社交媒体多分类精神健康状态预测

本文探索使用社交媒体数据预测多种心理健康状况的自动化检测方法，根据诸如句法复杂性、词汇复杂性和多样性、情感等语言特征，基于混合和集成模型的比较后发现多分类模型在自动化心理健康检测研究中更加准确有效。

Dec, 2022

使用变形金刚对心理健康帖子进行因果分类

本研究使用 transformer 模型对 CAMS 数据集进行预训练的迁移学习，改善了现有分类器的效率，准确性取得了提升，证明了在社交媒体上对于心理健康分析中的因果关系的识别是必要的。

Jan, 2023

通过临床问卷学习实现简单灵活的精神障碍检测模型

研究了使用社交媒体的语言特征来检测心理健康问题，并提出了一种能够有效利用领域知识、可被应用于其他心理障碍以及能够提供可解释检测结果的模型。

Jun, 2023

通过扩展 Reddit 帖子确定影响心理健康的健康维度

本文提出了一种基于生成式 NLP 模型的简单而有效的数据增强方法，称为 prompt-based，应用于 Wellness Dimensions 的分类预筛选任务，该方法不仅优于 Easy-Data Augmentation 和 Backtranslation 等基线方法，而且在 F 分数和 Matthew 的相关系数方面均实现了明显的改进。

Jun, 2023

基于社交媒体的深度学习方法在精神健康预测中的应用

通过深度学习模型检测社交媒体用户的心理状况，可以更好地理解疾病并提供早期发现的手段。基于分层注意力网络的二元分类任务预测用户是否患有九种不同疾病中的一种，在四种疾病中表现出比先前设定的基准更高的性能，并通过检查模型的单词级注意权重分析分类相关的短语的限制。

Mar, 2020

使用 RoBERTa 在社交媒体上检测和分类心理疾病

本研究使用基于 Transformer 架构的 RoBERTa 模型，对社交媒体上的用户数据进行分析，以检测和分类抑郁症、焦虑症、双相情感障碍、注意力缺陷多动障碍和创伤后应激障碍等五种主要的心理疾病，从而促进公共健康系统的自动化诊断和分类流程。

Nov, 2020

小型不平衡文本数据情感检测的数据增强

情感识别在文本中，识别诸如喜悦或愤怒之类的情感，是 NLP 中的一个具有挑战性的问题，其中一个挑战是缺乏已注释有情感的可用数据集。本研究研究了数据增强技术对小规模不平衡数据集的影响，并且证实使用增强数据训练分类器模型可以显著改进情感识别性能。

Oct, 2023

数字时代的心理健康诊断：在社交媒体平台上利用情感分析对稀疏特征内容进行利用

通过分析社交媒体平台上人们的发帖和讨论，借助自然语言处理技术，本研究提出一种新颖的语义特征预处理技术，通过弱分类器减少特征稀疏性，采用模量循环实现自适应特征维度，深度挖掘和扩展上下文中的特征，训练一个机器学习模型来预测和分类精神障碍，通过 Reddit 精神健康数据集 2022 对焦虑、边缘型人格障碍和双相情感障碍等病症进行研究，解决了数据稀疏性挑战，显著提高了性能，为心理健康预测与监测提供创新解决方案。

Nov, 2023

探索社交媒体语料库上的数据增强方法

本研究探索了数据增强技术对文字分类的影响，使用多种数据增强技术，包括过采样、易用数据增强、反向翻译、灰度缩放以及一种少样本学习的方法 PTE。结果表明，数据增强技术对模型性能只有轻微且不一致的改进，少数同义词替换可以提高模型性能，灰度缩放需要进一步研究，PTE 的表现优于监督学习，尤其是在类别容易分离的情况下。

Mar, 2023