解读叙事:分析在 Reddit 上分享的个人药物经历
为了更有效地预防意外的阿片类药物过量,医务人员需要强大且及时的工具来有效识别患者的风险,本研究通过 Reddit 这类社区平台中的自述信息,构建了一个中等规模的含有 2500 条与阿片类药物相关的帖子语料库,对这些帖子进行了分阶段的注释,并通过研究这些注释在模型开发和质量方面的作用,评估了几种最先进的模型,结果显示,在高风险领域如阿片类药物使用障碍研究中,使用解释可以显著提高分类准确度。
Nov, 2023
本文利用 Reddit 帖子数据集,研究对滥用物质人群的污名化现象和用机器学习框架对 Reddit 文章进行划分的方法,并提出社会语境对于处理此类机器学习任务的重要性。
Feb, 2023
通过使用社交媒体数据,特别是由有实际使用经验的人生成的数据,来更好地了解物质使用障碍的临床和社会影响,并开发能够自动检测社交媒体数据中物质使用的临床和社会影响的系统,以帮助制定有效的公共卫生战略。
May, 2024
本文使用深度学习、BERT 模型以及情感分析来研究社交媒体中与合成类阿片类药物相关的帖子,分析了社交媒体和加密市场数据,探究人们对不同药物的感受和态度,最终建立了基于这些特征的时间感知神经模型,成功地 (具有统计学意义) 识别出物质滥用障碍。
Apr, 2023
通过事件的视角,本文提出了一种用于表征社交话语中与健康相关的信息搜寻的范例。利用 Reddit 帖子进行案例研究,以药物治疗 Opioid Use Disorder (OUD) 为例,建立了 TREAT-ISE 数据集,该数据集包含基于不同事件类型进行注释的 OUD 社交话语中的信息搜寻事件。并借助多个机器学习和深度学习分类器,建立了一个强大的性能基准(77.4% F1 score),并深入研究了 ChatGPT 在这一任务上的表现和错误,提供了有价值的见解和持续的表征工作。
Aug, 2023
本研究提供了一种基于语言线索和专家远程监督的方法,用于自动建立用户生成的医疗声明的可信度和作者的信任度。我们将这种方法应用于提取药物的罕见或未知副作用的任务,并证明其可以可靠地提取副作用和过滤错误的声明,同时确定有价值的医疗信息的可信用户。
May, 2017
利用基于语言模型的提取系统以及外部知识,从社交媒体用户帖子中自动提取与医疗状况相关的患者经历和医疗状况信息,可用于有效监测医疗谣言的传播和验证用户主张。
Apr, 2023
通过对 Reddit 上的用户帖子进行收集和分析,结合关注度双向长短期记忆模型,该研究利用机器学习技术成功识别出了滥用阿片类药物的用户,并通过关注层提取了关键词,从而更好地理解该算法如何区分药物使用者和非药物使用者。
Feb, 2024
本文针对社交媒体中的健康文本管理,设计了一种主题驱动的关键短语提取方案,提供了一个含有相关医疗信息的 KE 数据集 SuboxoPhrase,以及一个从 Reddit 中提取依赖性治疗药物的数据集案例,同时测试了 10 个常用的 KE 模型,为社交健康文本的大规模分析和有用的公共健康趋势或知识填补提供了基础。
Jan, 2023
当前精神健康危机中,从社交媒体内容中识别潜在的心理问题指标的重要性迅速增加。我们通过将 Reddit 内容中的健康维度的识别视为对健康概念提取和分类的挑战,引入了一种复杂的心理健康分析方法。我们构建了一个名为 WELLXPLAIN 的独特数据集,包括 3,092 个条目和总计 72,813 个词。该数据集还包括人工标注的文本片段,对健康概念分类过程中的决策提供了清晰的理由。我们发布这一数据集并分析初始基准的目的是引领面向医疗保健领域概念提取和分类的先进语言模型的创建。
Aug, 2023