探索社交媒体帖子以识别抑郁症: Reddit 数据集研究
本研究通过对社交媒体发帖进行分析,开发了一个金标准数据集,将人的抑郁水平分为 ' 未抑郁 '、' 中度抑郁 ' 和' 严重抑郁 ' 三种级别,并采用数据增强技术和机器学习算法,其中 Word2Vec 向量化技术和随机森林分类器在数据增强的模型中表现最佳,准确度和 F1 值均为 0.877 。
Feb, 2022
使用半监督学习技术提出了一种检测抑郁症严重程度的系统,通过预测帖子是否来自经历严重、中度或低(非诊断性)抑郁水平的用户,使用 Reddit 上的大量未标记社交媒体帖子进行训练模型的分类。在 LT-EDI@RANLP 2023 共享任务中,我们的框架排名第三。
Sep, 2023
本研究提出了一种混合神经网络模型,结合预训练的句子 BERT(SBERT)和卷积神经网络(CNN),通过分析 Reddit 上的帖子来检测抑郁症患者,该模型实现了 0.86 的准确性和 0.86 的 F1 分数,且超过了文献中其他机器学习模型的已有成果(F1 分数为 0.79)。该模型的结果表明了其在检测抑郁症患者方面的可行性,同时也可应用于其他文本分类任务以及不同的临床应用。
Feb, 2023
本研究旨在通过深度学习方法,结合 RoBERTa 和 DeBERTa 模型,并利用 DepSign-LT-EDI 任务对社交媒体文本进行分类,进一步加强对精神健康对话的理解,最终取得了优越的性能表现,同时提供了相关代码以促进透明度和进一步发展。
Nov, 2023
通过研究学生在社交媒体上发布的图片和标题,使用深度学习进行功能工程模型从而检测大学生抑郁症状严重程度的研究表明,具有 BDI 得分大于或等于 20 的学生可以在最佳情况下通过融合模型达到 0.92 的召回率和 0.69 的精度,这表明了大规模抑郁症筛查的潜力,从而有助于发现处于风险的学生。
Dec, 2019
本文介绍了我们参加 IberLEF 2023 中的 MentalRiskES 任务,使用传统机器学习和深度学习技术预测了个体社交媒体活动导致抑郁的可能性,其中使用 BRET-based 模型微调和使用线性回归器作为输入的句子嵌入的两种建模方法,结果表明后者获得了更好的结果。
Jun, 2023
本文提出了一个有效的语义管道,基于社交媒体的写作,研究个体的抑郁症严重程度。通过计算方法,利用用户生成的社交媒体内容,本文探讨了不同聚合方法以准确预测用户症状严重程度,并在 Reddit 的两个基准测试中取得了 30%的提高。
Nov, 2022
本文提出了一种神经框架来支持研究在线支持社区和 Twitter、Reddit 等一般社区的用户,介绍了一种鉴别自伤风险发帖的方法,并展示了在 RSDD 一般论坛数据集上通过自然语言分析识别出抑郁症用户的方法优于强基线。
Sep, 2017
通过分析社交媒体上用户的历史帖子,我们提出了一种名为 DORIS 的新型抑郁症检测系统,结合医学知识和大型语言模型的最新进展,在早期检测和干预上具有重要作用,并且该系统通过结合传统分类器和大型语言模型,融合医学知识引导的特征,实现了高准确性和可解释性的预测结果。
Mar, 2024
通过对 DepressionEmo 数据集进行情感、时间分布和语言分析,并使用文本分类方法,特别是 BERT 模型,研究表明该数据集在通过文本分析来识别抑郁症患者的情感上具有一定的价值,其中自杀意图情感所达到的最高 F1-Macro 值表明了这一点。
Jan, 2024