MASON-NLP 参加 eRisk 2023:基于深度学习的社交媒体文本抑郁症状检测
本文介绍了我们参加 IberLEF 2023 中的 MentalRiskES 任务,使用传统机器学习和深度学习技术预测了个体社交媒体活动导致抑郁的可能性,其中使用 BRET-based 模型微调和使用线性回归器作为输入的句子嵌入的两种建模方法,结果表明后者获得了更好的结果。
Jun, 2023
本研究使用 ChatGPT 生成合成数据,并使用语义搜索和余弦相似度来确定 Reddit 社交媒体句子对 BDI-II 症状的相关性,发现对于句子嵌入,使用专门用于语义搜索的模型胜过对精神健康数据进行预训练的模型。
Jul, 2023
本研究旨在通过深度学习方法,结合 RoBERTa 和 DeBERTa 模型,并利用 DepSign-LT-EDI 任务对社交媒体文本进行分类,进一步加强对精神健康对话的理解,最终取得了优越的性能表现,同时提供了相关代码以促进透明度和进一步发展。
Nov, 2023
通过挖掘互联网用户发布的在线出版物中的抑郁症迹象,计算机方法可以进行抑郁症检测,但是现有集合上训练的解决方案具有较有限的概括性和可解释性。为解决这些问题,最近的研究表明,通过识别抑郁症状可以得到更稳健的模型。eRisk 倡议在这一领域推动研究,并最近提出了一个新的排名任务,重点是开发搜索方法来找到与抑郁症状相关的句子。这个搜索挑战依赖于贝克抑郁症量表(BDI-II)指定的症状,该量表被广泛应用于临床实践。根据参与系统的结果,我们推出了 DepreSym 数据集,该数据集包含 21580 个句子,根据其与 21 个 BDI-II 症状的相关性进行了注释。这些标记的句子来自各种排名方法的池,最终数据集是推进模型开发的宝贵资源,其中包括临床症状等抑郁标记。由于相关性注释的复杂性质,我们设计了一个由三名专家评估员(包括一位专业心理学家)进行的强大评估方法。此外,我们在这里探讨了使用最近的大型语言模型(ChatGPT 和 GPT4)作为潜在评估员的可行性,对其性能进行了全面的考察,确定了它们的主要局限性,并分析了它们作为人类标注者的补充或替代角色。
Aug, 2023
通过使用基于不同单词嵌入的卷积神经网络和基于用户级语言元数据的分类,本文着眼于利用社交平台上的信息对抑郁症进行早期检测,同时提出了一种略微修改的 ERDE 得分用于衡量早期检测系统,并评估了用于相同领域的大型语料库的新单词嵌入
Apr, 2018
通过分析社交媒体上用户的历史帖子,我们提出了一种名为 DORIS 的新型抑郁症检测系统,结合医学知识和大型语言模型的最新进展,在早期检测和干预上具有重要作用,并且该系统通过结合传统分类器和大型语言模型,融合医学知识引导的特征,实现了高准确性和可解释性的预测结果。
Mar, 2024
本文提出了一个有效的语义管道,基于社交媒体的写作,研究个体的抑郁症严重程度。通过计算方法,利用用户生成的社交媒体内容,本文探讨了不同聚合方法以准确预测用户症状严重程度,并在 Reddit 的两个基准测试中取得了 30%的提高。
Nov, 2022
通过研究学生在社交媒体上发布的图片和标题,使用深度学习进行功能工程模型从而检测大学生抑郁症状严重程度的研究表明,具有 BDI 得分大于或等于 20 的学生可以在最佳情况下通过融合模型达到 0.92 的召回率和 0.69 的精度,这表明了大规模抑郁症筛查的潜力,从而有助于发现处于风险的学生。
Dec, 2019
本文提出了一种基于文本单元、词类标记、可读性度量以及第一、第二或第三人称和单词数的方法来检测社交媒体文本中的抑郁迹象。我们的最佳模型获得了 0.439 的宏 F1 分数,排名 31 个团队中的第 25 名。我们进一步利用逻辑回归模型的可解释性,并尝试解释模型系数,以期对该主题的进一步研究有所帮助。
Apr, 2022