social media data has become crucial to the advancement of scientific
understanding. However, even though it has become ubiquitous, just collecting
large-scale social media data involves a high degree of engineer
通过自然语言处理和机器学习分类器,本研究以 Reddit 学术社群为对象,检测和分析与压力相关的帖子,发现 Bag of Words 与 Logistic Regression 分类器结合在压力检测上效果最佳,准确率达到 77.78%,F1 得分为 0.79。研究结果表明,与本科生、研究生和博士生等学术层次相比,教授在 Reddit 社群中的帖子和评论是最具压力的。本研究对于了解学术社群压力水平具有重要意义,可以帮助学术机构和在线社群有效地解决这一问题。