Feb, 2022

社交媒体帖子中检测抑郁症迹象的数据集创建及实证分析

TL;DR本研究通过对社交媒体发帖进行分析,开发了一个金标准数据集,将人的抑郁水平分为 ' 未抑郁 '、' 中度抑郁 ' 和' 严重抑郁 ' 三种级别,并采用数据增强技术和机器学习算法,其中 Word2Vec 向量化技术和随机森林分类器在数据增强的模型中表现最佳,准确度和 F1 值均为 0.877 。