KDDAug, 2018
基于多尺度图划分的内容驱动非监督式新闻文章聚类
Content-driven, unsupervised clustering of news articles through multiscale graph partitioning
M. Tarik Altuncu, Sophia N. Yaliraki, Mauricio Barahona
TL;DR介绍了一种利用自然语言处理和图论工具结合的方法,通过向量表示和多尺度社团检测技术对文本进行分析和分类,得出了一组组具有相似内容的文档,揭示了主题和子主题的类层次结构。