May, 2023

基于社交媒体属性的关键词检测:Sina 微博上的 IDF-LDA 模型应用

TL;DR本文提出了一种基于 IDF 和 LDA 模型相结合的方法,以更好地应对社交媒体数据的不同属性,通过基于点赞数、评论数和转发数等属性来加权每个文档的重要性,从而有效地检测出越来越具有代表性的关键词,实验证明该方法在各种评估指标,包括多个问题设置的精度和召回率等方面优于基准。