探索社交媒体帖子以识别抑郁症: Reddit 数据集研究

Apr, 2024

探索社交媒体帖子以识别抑郁症: Reddit 数据集研究

Exploring Social Media Posts for Depression Identification: A Study on Reddit Dataset

Nandigramam Sai Harshit, Nilesh Kumar Sahu, Haroon R. Lone

TL;DR利用社交媒体帖子识别抑郁症的研究表明，通过对 2022 年抑郁症相关论坛 Reddit 上的热门帖子进行提取和分析，预处理后的数据输入传统机器学习模型，可达到 92.28% 的准确率。

Abstract

depression is one of the most common mental disorders affecting an individual's personal and professional life. In this work, we investigated the possibility of utilizing social media posts to identify

depression social media posts reddit machine learning models accuracy

发现论文，激发创造

社交媒体帖子中检测抑郁症迹象的数据集创建及实证分析

本研究通过对社交媒体发帖进行分析，开发了一个金标准数据集，将人的抑郁水平分为 ' 未抑郁 '、' 中度抑郁 ' 和' 严重抑郁 ' 三种级别，并采用数据增强技术和机器学习算法，其中 Word2Vec 向量化技术和随机森林分类器在数据增强的模型中表现最佳，准确度和 F1 值均为 0.877 。

Feb, 2022

Cordyceps@LT-EDI：基于 Reddit 和自我训练的抑郁症检测

使用半监督学习技术提出了一种检测抑郁症严重程度的系统，通过预测帖子是否来自经历严重、中度或低（非诊断性）抑郁水平的用户，使用 Reddit 上的大量未标记社交媒体帖子进行训练模型的分类。在 LT-EDI@RANLP 2023 共享任务中，我们的框架排名第三。

Sep, 2023

利用混合神经网络检测 Reddit 用户的抑郁症状

本研究提出了一种混合神经网络模型，结合预训练的句子 BERT（SBERT）和卷积神经网络（CNN），通过分析 Reddit 上的帖子来检测抑郁症患者，该模型实现了 0.86 的准确性和 0.86 的 F1 分数，且超过了文献中其他机器学习模型的已有成果（F1 分数为 0.79）。该模型的结果表明了其在检测抑郁症患者方面的可行性，同时也可应用于其他文本分类任务以及不同的临床应用。

Feb, 2023

DeepLearningBrasil@LT-EDI-2023：探索社交媒体文本中用于检测抑郁症的深度学习技术

本研究旨在通过深度学习方法，结合 RoBERTa 和 DeBERTa 模型，并利用 DepSign-LT-EDI 任务对社交媒体文本进行分类，进一步加强对精神健康对话的理解，最终取得了优越的性能表现，同时提供了相关代码以促进透明度和进一步发展。

Nov, 2023

使用多模态社交媒体数据检测高等教育学生的抑郁症状

通过研究学生在社交媒体上发布的图片和标题，使用深度学习进行功能工程模型从而检测大学生抑郁症状严重程度的研究表明，具有 BDI 得分大于或等于 20 的学生可以在最佳情况下通过融合模型达到 0.92 的召回率和 0.69 的精度，这表明了大规模抑郁症筛查的潜力，从而有助于发现处于风险的学生。

Dec, 2019

社交媒体上识别抑郁的框架： MentalRiskES@IberLEF 2023

本文介绍了我们参加 IberLEF 2023 中的 MentalRiskES 任务，使用传统机器学习和深度学习技术预测了个体社交媒体活动导致抑郁的可能性，其中使用 BRET-based 模型微调和使用线性回归器作为输入的句子嵌入的两种建模方法，结果表明后者获得了更好的结果。

Jun, 2023

用于抑郁症程度估计的语义相似性模型

本文提出了一个有效的语义管道，基于社交媒体的写作，研究个体的抑郁症严重程度。通过计算方法，利用用户生成的社交媒体内容，本文探讨了不同聚合方法以准确预测用户症状严重程度，并在 Reddit 的两个基准测试中取得了 30％的提高。

Nov, 2022

网络论坛中的抑郁症和自残风险评估

本文提出了一种神经框架来支持研究在线支持社区和 Twitter、Reddit 等一般社区的用户，介绍了一种鉴别自伤风险发帖的方法，并展示了在 RSDD 一般论坛数据集上通过自然语言分析识别出抑郁症用户的方法优于强基线。

Sep, 2017

利用大型语言模型在社交媒体上进行抑郁症检测

通过分析社交媒体上用户的历史帖子，我们提出了一种名为 DORIS 的新型抑郁症检测系统，结合医学知识和大型语言模型的最新进展，在早期检测和干预上具有重要作用，并且该系统通过结合传统分类器和大型语言模型，融合医学知识引导的特征，实现了高准确性和可解释性的预测结果。

Mar, 2024

抑郁情绪多标签分类的新颖数据集

通过对 DepressionEmo 数据集进行情感、时间分布和语言分析，并使用文本分类方法，特别是 BERT 模型，研究表明该数据集在通过文本分析来识别抑郁症患者的情感上具有一定的价值，其中自杀意图情感所达到的最高 F1-Macro 值表明了这一点。

Jan, 2024