Nov, 2014

使用语言学特征估算中国微博用户的自杀概率

TL;DR通过微博等社交媒体识别自杀高危人群,实现积极的干预系统,本研究针对新浪微博的 1041 个用户,采用中文版 Linguistic Inquiry and Word Count(LIWC)词库和 LDA 等 NLP 方法提取语言特征,基于这两种特征通过机器学习算法训练预测模型,以估算基于语言特征的自杀概率。实验结果表明,LDA 能够找到与自杀概率相关的主题并提高预测性能,此研究为预测社交网络用户自杀概率行为增加了价值。