在泰国博客文章中检测抑郁症：数据集和基线

EMNLPNov, 2021

在泰国博客文章中检测抑郁症：数据集和基线

Detecting Depression in Thai Blog Posts: a Dataset and a Baseline

Mika Hämäläinen, Pattama Patpong, Khalid Alnajjar, Niko Partanen, Jack Rueter

TL;DR本研究提出了第一个用于检测泰语抑郁症的公开语料库，并通过两种不同的 LSTM 模型和两种不同的 BERT 模型进行实验。我们使用泰语 BERT 模型在检测抑郁症方面取得了 77.53％的准确性，并针对该语料库将此结果作为基准线记录在案，发现需要比维基百科更多样化语料库训练的泰语嵌入。我们已在 Zenodo 上公开发布了语料库、代码和训练模型。

Abstract

We present the first openly available corpus for detecting depression in Thai. Our corpus is compiled by expert verified cases of depression in several online blogs. We experiment with two different LSTM based mo

depression thai corpus lstm model bert model thai embeddings

发现论文，激发创造

DeepLearningBrasil@LT-EDI-2023：探索社交媒体文本中用于检测抑郁症的深度学习技术

本研究旨在通过深度学习方法，结合 RoBERTa 和 DeBERTa 模型，并利用 DepSign-LT-EDI 任务对社交媒体文本进行分类，进一步加强对精神健康对话的理解，最终取得了优越的性能表现，同时提供了相关代码以促进透明度和进一步发展。

Nov, 2023

利用大型语言模型在社交媒体上进行抑郁症检测

通过分析社交媒体上用户的历史帖子，我们提出了一种名为 DORIS 的新型抑郁症检测系统，结合医学知识和大型语言模型的最新进展，在早期检测和干预上具有重要作用，并且该系统通过结合传统分类器和大型语言模型，融合医学知识引导的特征，实现了高准确性和可解释性的预测结果。

Mar, 2024

从社交媒体文本中检测抑郁症状

本文提出了一种基于文本单元、词类标记、可读性度量以及第一、第二或第三人称和单词数的方法来检测社交媒体文本中的抑郁迹象。我们的最佳模型获得了 0.439 的宏 F1 分数，排名 31 个团队中的第 25 名。我们进一步利用逻辑回归模型的可解释性，并尝试解释模型系数，以期对该主题的进一步研究有所帮助。

Apr, 2022

EmoScan：罗马化僧伽罗语推文中抑郁症状自动筛查

通过对罗马化僧伽罗社交媒体数据的利用，本研究提出了一个基于机器学习的框架，通过分析语言模式、情感和行为线索在全面的社交媒体帖子数据集中自动筛查抑郁症状。结果表明，提出的具有注意力层的神经网络在检测抑郁症状方面取得了 93.25％的显著准确度，超过了当前最先进的方法。这些发现强调了该方法在定位需要积极干预和支持的个体方面的功效。该研究对心理健康专业人士、政策制定者和社交媒体公司提供了有价值的见解。通过利用自然语言处理技术和机器学习算法，本研究为数字时代的心理健康筛查提供了一个有前途的路径。通过利用社交媒体数据的潜力，该框架引入了一种识别和援助抑郁风险个体的积极方法。总之，本研究在积极干预和支持心理健康系统方面做出了贡献，从而对领域内的研究和实际应用产生影响。

Mar, 2024

利用大型语言模型对变压器模型进行优化以检测孟加拉抑郁社交媒体文本：一项综合研究

我们的研究关注心理健康和社交媒体之间的重要联系，特别是在外向的社交媒体用户中早期检测到抑郁症。通过使用 GPT 3.5、GPT 4 和我们提出的 GPT 3.5 微调模型 DepGPT，以及先进的深度学习模型（LSTM、Bi-LSTM、GRU、BiGRU）和 Transformer 模型（BERT、BanglaBERT、SahajBERT、BanglaBERT-Base），我们对 Reddit 和 X 数据集进行分类，并由精通心理健康的母语使用者将其翻译成孟加拉文，从而创建了孟加拉社交媒体抑郁数据集（BSMDD）。我们的工作提供了每个模型的完整架构细节，并提供了一种系统评估其在孟加拉抑郁文本分类中的性能的方法，使用零样本学习和少样本学习技术。我们的工作证明了 SahajBERT 和具有 FastText 嵌入的 Bi-LSTM 在各自领域的优越性，并解决了 Transformer 模型的可解释性问题，强调了 LLM 的有效性，特别是 DepGPT，在各种学习环境中的灵活性和能力。根据实验结果，所提出的 DepGPT 模型不仅在零样本学习和少样本学习场景中胜过了 Alpaca Lora 7B，而且在准确度和 F1 分数方面也优于其他模型，达到了近乎完美的准确度为 0.9796 和 F1 分数为 0.9804，拥有高召回率和卓越精确度。尽管竞争激烈，GPT-3.5 Turbo 和 Alpaca Lora 7B 在零样本学习和少样本学习情况下相对效果较差。这项工作强调了 LLM 在各种语言环境中的有效性和灵活性，为抑郁症检测模型的复杂领域提供了深入的信息。

Jan, 2024

我们关心：多模态抑郁症检测与知识注入型心理健康治疗响应生成

使用非语言线索检测抑郁症，引入虚拟助手与认知行为疗法基于的回应，取得了显著成果。

Jun, 2024

社交媒体上识别抑郁的框架： MentalRiskES@IberLEF 2023

本文介绍了我们参加 IberLEF 2023 中的 MentalRiskES 任务，使用传统机器学习和深度学习技术预测了个体社交媒体活动导致抑郁的可能性，其中使用 BRET-based 模型微调和使用线性回归器作为输入的句子嵌入的两种建模方法，结果表明后者获得了更好的结果。

Jun, 2023

时间丰富的多模态转换器检测抑郁症

本文提出了一种基于预训练模型，使用图像和文本嵌入的弹性时间丰富多模态变压器模型，用于从社交媒体消息中检测抑郁症，结果表明该方法超越了其他方法，达到了 0.931 F1 值，是目前最先进的方法。

Jan, 2023

社交媒体帖子中检测抑郁症迹象的数据集创建及实证分析

本研究通过对社交媒体发帖进行分析，开发了一个金标准数据集，将人的抑郁水平分为 ' 未抑郁 '、' 中度抑郁 ' 和' 严重抑郁 ' 三种级别，并采用数据增强技术和机器学习算法，其中 Word2Vec 向量化技术和随机森林分类器在数据增强的模型中表现最佳，准确度和 F1 值均为 0.877 。

Feb, 2022

利用神经网络和语言元数据对文本序列中的抑郁症状进行早期检测

通过使用基于不同单词嵌入的卷积神经网络和基于用户级语言元数据的分类，本文着眼于利用社交平台上的信息对抑郁症进行早期检测，同时提出了一种略微修改的 ERDE 得分用于衡量早期检测系统，并评估了用于相同领域的大型语料库的新单词嵌入

Apr, 2018