您的模型未能很好地预测抑郁症的原因：PRIMATE 数据集的案例研究

Mar, 2024

您的模型未能很好地预测抑郁症的原因：PRIMATE 数据集的案例研究

Your Model Is Not Predicting Depression Well And That Is Why: A Case Study of PRIMATE Dataset

Kirill Milintsevich, Kairit Sirts, Gaël Dias

TL;DR本研究关注于精神健康数据集中的注释质量，特别是使用社交媒体文本进行基于自然语言处理的抑郁水平估计。通过重新注释和引入更精细的标签和文本范围，我们发现针对 PRIMATE 数据集的注释有效性存在关注点，特别是缺乏兴趣或愉悦症状，并识别出了相当数量的假阳性。我们通过发布经过精细标注的数据集，在应用数据使用协议的前提下，为无情感体验检测提供了更高质量的测试集。本研究强调了在精神健康数据集中解决注释质量问题的必要性，并倡导改进方法论以提高自然语言处理模型在精神健康评估中的可靠性。

Abstract

This paper addresses the quality of annotations in mental health datasets used for nlp-based depression level estimation from social media

annotations mental health datasets nlp-based depression level estimation primate dataset annotation validity

发现论文，激发创造

通过利用临床问卷提高抑郁症检测的泛化能力

本研究提出通过将模型约束在医生在抑郁筛选过程中使用的 PHQ9 表中描述的症状中以不同程度地控制抑郁症检测的方法。在三个社交媒体数据集的数据集转移实验中，我们发现将模型限定于 PHQ9 的症状可以显著提高模型对于分布外数据的泛化能力，而在本领域数据上也可以具有竞争力。此外，这种方法还可以产生更易于检查的模型，从而提高了模型的泛化能力。

Apr, 2022

社交媒体帖子中检测抑郁症迹象的数据集创建及实证分析

本研究通过对社交媒体发帖进行分析，开发了一个金标准数据集，将人的抑郁水平分为 ' 未抑郁 '、' 中度抑郁 ' 和' 严重抑郁 ' 三种级别，并采用数据增强技术和机器学习算法，其中 Word2Vec 向量化技术和随机森林分类器在数据增强的模型中表现最佳，准确度和 F1 值均为 0.877 。

Feb, 2022

DeepLearningBrasil@LT-EDI-2023：探索社交媒体文本中用于检测抑郁症的深度学习技术

本研究旨在通过深度学习方法，结合 RoBERTa 和 DeBERTa 模型，并利用 DepSign-LT-EDI 任务对社交媒体文本进行分类，进一步加强对精神健康对话的理解，最终取得了优越的性能表现，同时提供了相关代码以促进透明度和进一步发展。

Nov, 2023

DepreSym：一个抑郁症状标注语料库及 LLMs 作为心理标志评估者的角色

通过挖掘互联网用户发布的在线出版物中的抑郁症迹象，计算机方法可以进行抑郁症检测，但是现有集合上训练的解决方案具有较有限的概括性和可解释性。为解决这些问题，最近的研究表明，通过识别抑郁症状可以得到更稳健的模型。eRisk 倡议在这一领域推动研究，并最近提出了一个新的排名任务，重点是开发搜索方法来找到与抑郁症状相关的句子。这个搜索挑战依赖于贝克抑郁症量表（BDI-II）指定的症状，该量表被广泛应用于临床实践。根据参与系统的结果，我们推出了 DepreSym 数据集，该数据集包含 21580 个句子，根据其与 21 个 BDI-II 症状的相关性进行了注释。这些标记的句子来自各种排名方法的池，最终数据集是推进模型开发的宝贵资源，其中包括临床症状等抑郁标记。由于相关性注释的复杂性质，我们设计了一个由三名专家评估员（包括一位专业心理学家）进行的强大评估方法。此外，我们在这里探讨了使用最近的大型语言模型（ChatGPT 和 GPT4）作为潜在评估员的可行性，对其性能进行了全面的考察，确定了它们的主要局限性，并分析了它们作为人类标注者的补充或替代角色。

Aug, 2023

通过大型语言模型合成数据检测难治性抑郁的临床特征

通过大型语言模型和 BERT 基于跨度抽取模型，能够提取和标记与难治性抑郁症相关的各种正面和负面因素的文本跨度，为未来医疗应用提供了希望。

Feb, 2024

基于社交媒体文本的抑郁症状建模：一种半监督学习方法

使用半监督学习和大规模文本预训练语言模型，基于社交媒体语言数据，构建了最大的自述抑郁症状识别数据集，并训练出表现显著提高的抑郁症状检测模型。

Sep, 2022

抑郁情绪多标签分类的新颖数据集

通过对 DepressionEmo 数据集进行情感、时间分布和语言分析，并使用文本分类方法，特别是 BERT 模型，研究表明该数据集在通过文本分析来识别抑郁症患者的情感上具有一定的价值，其中自杀意图情感所达到的最高 F1-Macro 值表明了这一点。

Jan, 2024

利用 ChatGPT 生成的数据从社交媒体检索抑郁症状

本研究使用 ChatGPT 生成合成数据，并使用语义搜索和余弦相似度来确定 Reddit 社交媒体句子对 BDI-II 症状的相关性，发现对于句子嵌入，使用专门用于语义搜索的模型胜过对精神健康数据进行预训练的模型。

Jul, 2023

利用过程知识学习自动化生成跟进问题以在 Reddit 帖子上进行抑郁症分流

研究表明深度语言模型辅助的对话代理在心理健康方面具有很大潜力，用于提供信息性和治疗性服务，在抑郁症方面的实验显示控制生成问题对于精神保健评估是合适的，创造一个名为 PRIMATE 的数据集，用以培训深度语言模型。

May, 2022

我们关心：多模态抑郁症检测与知识注入型心理健康治疗响应生成

使用非语言线索检测抑郁症，引入虚拟助手与认知行为疗法基于的回应，取得了显著成果。

Jun, 2024