TensiStrength:社交媒体文本中的应激和放松程度检测
使用 BERT 和 MentalBERT 模型,将额外的语言信息注入到社交媒体上进行的压力和抑郁症检测中,通过 Multimodal Adaptation Gate 此方法在三个公开数据集上的表现有所提高。标签平滑化可以提高模型性能和调整模型。在压力和抑郁症文章中观察到了语言差异。
May, 2023
这篇论文介绍了一份新的文本语料库 Dreaddit,该语料库包含来自五个不同类别 Reddit 社群的 19 万条帖子,用于识别长篇社交媒体数据中的压力表征,并提出了基于监督学习的方法。
Oct, 2019
通过自然语言处理和机器学习分类器,本研究以 Reddit 学术社群为对象,检测和分析与压力相关的帖子,发现 Bag of Words 与 Logistic Regression 分类器结合在压力检测上效果最佳,准确率达到 77.78%,F1 得分为 0.79。研究结果表明,与本科生、研究生和博士生等学术层次相比,教授在 Reddit 社群中的帖子和评论是最具压力的。本研究对于了解学术社群压力水平具有重要意义,可以帮助学术机构和在线社群有效地解决这一问题。
Dec, 2023
该研究使用两个数据集,提出了两个多任务学习框架,使用抑郁症和压力作为主要和辅助任务,旨在利用社交媒体挖掘抑郁和压力信息,实现其早期识别。实验显示,该方法相比于传统单任务学习和迁移学习有多重优势。
May, 2023
利用机器学习和自然语言处理方法,在社交媒体上提出了一种自动检测抑郁症的方法。该方法采用文本表示的多种类型来检测抑郁症,并通过情感信息进行上下文化描述。该研究分析了分类模型的能量消耗,并建立了分类精度和计算成本之间的权衡。实验表明,提出的上下文化策略可以提高分类精度,并且使用 Transformers 的方法可以将总体 F 分数提高 2%,但能源成本增加一百倍。最后,该工作为未来的节能系统铺平了道路,同时考虑了性能和能源消耗。
Jun, 2023
本研究提出了一种基于 Experts Model 的架构,它可以从特征向量中学习不同的特征集,有助于更好地从推文中检测情感。与基准结果和 SemEval-2018 任务 1 的前五名表现者相比,实验结果表明,我们提出的方法在情感检测问题上表现出了较好的结果。
Mar, 2019
本文介绍了使用广义回归器系统在推文中估计情绪强度的实验。系统结合了词法、句法和预训练词向量特征,对通用回归器进行训练,并最终结合最佳表现模型创建一个集成系统。所提出的系统在 WASSA-2017 共享任务情感强度排行榜中名列第三。
Aug, 2017
本文提出了一种基于文本单元、词类标记、可读性度量以及第一、第二或第三人称和单词数的方法来检测社交媒体文本中的抑郁迹象。我们的最佳模型获得了 0.439 的宏 F1 分数,排名 31 个团队中的第 25 名。我们进一步利用逻辑回归模型的可解释性,并尝试解释模型系数,以期对该主题的进一步研究有所帮助。
Apr, 2022
本文旨在研究从文本中检测情感强度的任务。我们创建了第一个标记有愤怒、恐惧、喜悦和悲伤强度的推文数据集,并使用最佳 - 最差比例(BWS)技术提高注释一致性和获得可靠的细粒度分数。我们发现情感词 hashtag 通常会影响情感强度,通常传达更强烈的情感。最后,我们创建了一个基准回归系统,并进行实验,以确定哪些特征对于检测情感强度有用,以及两种情感在语言表现方面的相似程度。
Aug, 2017