Motivated with recent advances in inferring users' mental state in social
media posts, we identify and formulate the problem of finding causal indicators
behind mental illness in self-reported text. In the past,
基于社交媒体帖子的精神障碍预测在当前语言模型的限制下面临挑战,本研究提出了一个创新框架,通过将社交媒体帖子的大量时间顺序压缩为一系列数字,实现了精神障碍的分类,并在三种精神病症(抑郁症、自残和厌食症)中相比当前最优方法在 F1 得分上提升了 5%,同时强调了文本数据的时间属性的重要性,探索了跨领域研究的可能性。
本文研究利用数据增强技术对社交媒体用户生成文本进行分类的效果,发现 Easy Data Augmentation,conditional BERT 和 Back Translation 等技术对于分类器性能的提高有潜力,这对于存在缺乏标记数据和倫理清晰的社会媒体平台上的自动生成的文本的心理健康分类是有意义的。