MentSum:探索在线心理健康文章摘要的资源
本研究旨在通过采用课程学习方法,结合基于 Transformers 模型的自动生成摘要技术,从 Reddit 社交媒体上的心理健康相关帖子中提取性问题,从而提高医生的阅读效率和准确性,为人们提供更及时有效的心理卫生服务。相较于目前已有的模型,本方法在 Rouge 和 Bertscore 评估指标上分别有显著的相对改进。
Feb, 2023
本文介绍了 TLDR9 +—— 一个从 Reddit 讨论论坛中提取的包含 900 万多个训练实例的大规模摘要数据集,旨在进行极端摘要,并通过人工注释蒸馏出更细粒度的 TLDRHQ 数据集,进一步点出我们所提出的数据集上不同的最先进的摘要模型。
Oct, 2021
通过 Reddit TIFU 数据集,我们提出了一个多层记忆网络模型用于抽象总结,并通过客观评估以及用户研究等手段发现该模型高度抽象化,优于现有的总结模型。
Nov, 2018
当前精神健康危机中,从社交媒体内容中识别潜在的心理问题指标的重要性迅速增加。我们通过将 Reddit 内容中的健康维度的识别视为对健康概念提取和分类的挑战,引入了一种复杂的心理健康分析方法。我们构建了一个名为 WELLXPLAIN 的独特数据集,包括 3,092 个条目和总计 72,813 个词。该数据集还包括人工标注的文本片段,对健康概念分类过程中的决策提供了清晰的理由。我们发布这一数据集并分析初始基准的目的是引领面向医疗保健领域概念提取和分类的先进语言模型的创建。
Aug, 2023
通过方面导向的总结来评估大型语言模型在心理健康咨询中的应用,研究发现任务特定的语言模型在心理咨询的各个方面表现出较好的综合性能。
Feb, 2024
我们引入了临床意义的社交媒体用户时间线总结的新任务,适用于精神健康监测。我们开发了一种新颖的无监督抽象总结方法,生成由高层次信息和用户社交媒体时间线中与时间敏感证据相配套的双层总结。我们的方法的关键方法创新来自基于一种适应表示长文本的分层变分自动编码器(VAE)版本和由 LLM 注释的关键短语引导的时间线总结组件。通过自动评估和临床专家的人工评估,我们评估了我们的新型架构生成的总结,结果显示 TH-VAE 进行的时间线总结逻辑连贯,临床效用丰富,并且在捕捉时间变化方面优于仅使用 LLM 方法。
Jan, 2024
通过分析社交媒体平台上人们的发帖和讨论,借助自然语言处理技术,本研究提出一种新颖的语义特征预处理技术,通过弱分类器减少特征稀疏性,采用模量循环实现自适应特征维度,深度挖掘和扩展上下文中的特征,训练一个机器学习模型来预测和分类精神障碍,通过 Reddit 精神健康数据集 2022 对焦虑、边缘型人格障碍和双相情感障碍等病症进行研究,解决了数据稀疏性挑战,显著提高了性能,为心理健康预测与监测提供创新解决方案。
Nov, 2023
该研究提出了一种基于多种特征的框架来将用户发帖在划分为四个自残意象严重程度级别,并使用该模型分析用户的心理状态,并展示长期使用论坛的用户的风险程度减少的情况,该模型对有效识别用户自残风险方面大幅优于现有技术(F-1 分数高达 17% 的提升),同时指出在没有自动方式识别关键内容的条件下,对于管理员来说,及时解决用户的诉求非常具有挑战性。
Feb, 2017
本研究旨在通过基于领域知识建立心理健康辅导摘要来帮助顾问快速获取含义,我们创建了一个新的数据集,包括关于辅导组件的 12.9K 次言语注释及参考摘要,并提出了 ConSum,一种新颖的辅导组件引导摘要模型,表现出更好的性能和生成的摘要具有连贯、语义和完整的特点。
Jun, 2022
研究开发了一种新的情感标注的心理健康语料库 (EmoMent),从 Sri Lanka 和印度提取了 2802 篇 Facebook 帖子 (14845 句子),并使用 RoBERTa 模型对其进行自动分类分析,证明了情感分析的潜力。
Aug, 2022