Sep, 2023

人格分析:社交媒体个人资料对预测个人信息有多大的信息量?

TL;DR通过分析个人的在线数字足迹,我们比较和研究了逻辑回归、朴素贝叶斯、支持向量机和随机森林等四个模型在预测人们完整性格类型方面的准确性和多样性,结果显示 SVM 模型以 20.95% 的准确性表现最优,尽管逻辑回归模型稍有劣势,但培训速度和预测性能明显更快,我们发现社交媒体上的个人特征标记数据集以及其他数据集都存在较大的类别不平衡问题,因此强调了在这些数据集上报告模型性能时需予以谨慎,同时我们比较了几种解决类别不平衡问题的方法,并开发了一个统计框架来评估模型中不同特征集的重要性,研究发现,对于直觉 / 感知模型(p = 0.032)和思维 / 情感模型(p = 0.019),某些特征相对于其他特征更具信息量,尽管我们将这些方法应用于 Myers-Briggs 性格分类中,但它们也可以更广泛地用于社交媒体上对个体的标记。