Aug, 2023

WellXplain:Reddit 帖子中的健康概念提取与分类,用于心理健康分析

TL;DR当前精神健康危机中,从社交媒体内容中识别潜在的心理问题指标的重要性迅速增加。我们通过将 Reddit 内容中的健康维度的识别视为对健康概念提取和分类的挑战,引入了一种复杂的心理健康分析方法。我们构建了一个名为 WELLXPLAIN 的独特数据集,包括 3,092 个条目和总计 72,813 个词。该数据集还包括人工标注的文本片段,对健康概念分类过程中的决策提供了清晰的理由。我们发布这一数据集并分析初始基准的目的是引领面向医疗保健领域概念提取和分类的先进语言模型的创建。