LOST：Reddit 中低自尊心的心理健康数据集

Jun, 2023

LOST：Reddit 中低自尊心的心理健康数据集

LOST: A Mental Health Dataset of Low Self-esteem in Reddit Posts

Muskan Garg, Manas Gaur, Raxit Goswami, Sunghwan Sohn

TL;DR本研究引入一项心理学基础和专家注释的数据集，旨在研究和检测 Reddit 上的低自尊心，并通过标注方法确保监督学习的金标准；本研究的结果表明，可以开发一类注入心理和临床知识的语言模型。

Abstract

low self-esteem and interpersonal needs (i.e., thwarted belongingness (TB) and perceived burdensomeness (PB)) have a major impact on depression and suicide attempts. Individuals seek social connectedness on

low self-esteem social media interpersonal needs mental health language models

发现论文，激发创造

用户笔文中心理概念抽取与分类的可靠性分析

社交 NLP 研究社区近期在心理健康分析的计算进展中见证了构建负责任的 AI 模型，以应对语言使用和自我认知之间的复杂相互作用。我们通过注释 LoST 数据集捕捉到 Reddit 用户帖子中表明低自尊的微妙文本线索，并发现 NLP 模型在确定低自尊时更关注三种类型的文本线索：触发词、LoST 指标和后果词。我们的研究结果表明，在 Reddit 帖子中确定低自尊时，需要将 PLMs 的重点从触发词和后果词转移到更全面的解释上，强调 LoST 指标。

Jan, 2024

社交媒体帖子中可解释人际风险因素的注释数据集

本研究构建并发布一个新的标注数据集，针对社交媒体上影响精神健康的人际风险因素进行分类和解释，以自然语言处理为切入点，建立模型并探讨以此为基础的 AI 个性化模型的未来研究方向。

May, 2023

Cordyceps@LT-EDI：基于 Reddit 和自我训练的抑郁症检测

使用半监督学习技术提出了一种检测抑郁症严重程度的系统，通过预测帖子是否来自经历严重、中度或低（非诊断性）抑郁水平的用户，使用 Reddit 上的大量未标记社交媒体帖子进行训练模型的分类。在 LT-EDI@RANLP 2023 共享任务中，我们的框架排名第三。

Sep, 2023

LonXplain: Reddit 帖子中精神障碍所导致的孤独感

研究探讨了如何利用自然语言处理从社交媒体的信息中推断潜在的心理状态，发现社交媒体用户在讲述日常经历时传达了他们的孤独或孤立的生活方式，对其心理健康产生影响。研究者们将社交媒体帖子中的孤独感检测作为一个可解释的二分类问题，发现了高风险用户，并建议早期采取应对孤独的措施。同时，提出了一个可读性强的数据集 LonXplain，其中包含了 1, 3, 521 Reddit 帖子的人工注释，旨在进一步研究和发展孤独感引起的心理障碍检测技术。

May, 2023

探索社交媒体帖子以识别抑郁症: Reddit 数据集研究

利用社交媒体帖子识别抑郁症的研究表明，通过对 2022 年抑郁症相关论坛 Reddit 上的热门帖子进行提取和分析，预处理后的数据输入传统机器学习模型，可达到 92.28% 的准确率。

Apr, 2024

抑郁症患者在社交媒体上表现出更多扭曲的思维

社交媒体上诊断为抑郁症患者的个体表现出较高的认知失调水平，尤其是个人化和情感推理，这种失调效应特定于表达的内容，可能会成为公认的导致抑郁症的在线语言模式的检测和缓解的依据，并有助于解释社交媒体对心理健康的负面影响。

Feb, 2020

用于抑郁症程度估计的语义相似性模型

本文提出了一个有效的语义管道，基于社交媒体的写作，研究个体的抑郁症严重程度。通过计算方法，利用用户生成的社交媒体内容，本文探讨了不同聚合方法以准确预测用户症状严重程度，并在 Reddit 的两个基准测试中取得了 30％的提高。

Nov, 2022

社交媒体帖子中检测抑郁症迹象的数据集创建及实证分析

本研究通过对社交媒体发帖进行分析，开发了一个金标准数据集，将人的抑郁水平分为 ' 未抑郁 '、' 中度抑郁 ' 和' 严重抑郁 ' 三种级别，并采用数据增强技术和机器学习算法，其中 Word2Vec 向量化技术和随机森林分类器在数据增强的模型中表现最佳，准确度和 F1 值均为 0.877 。

Feb, 2022

有关领域的角色：自杀风险评估的弱监督方法

研究表明，社交媒体成为自杀意念研究和自杀风险评估的有价值的资源。在众多社交媒体平台中，匿名性和基于主题的社群（子版块）使得 Reddit 成为最有希望的研究平台，而弱监督方法中使用志愿标记数据的小样本是现有方法面临的挑战。我们提出了一个用多个类别的弱监督方法的实证调查，并证明基于心理健康相关问题（例如，焦虑，抑郁症）的伪标签可以帮助提高自杀风险评估模型的性能。

Jun, 2021

自杀行为的概念化：利用预测结果的解释分析纵向社交媒体数据

通过分析社交媒体数据以及借助人工智能技术，本研究提出了一种用于初步筛选带有自杀意向的社交媒体帖子的方法，以预防自杀行为，并为自杀预防机构、专业人员和社区广泛认知项目提供宝贵的见解。

Dec, 2023