KDDAug, 2018

基于多尺度图划分的内容驱动非监督式新闻文章聚类

TL;DR介绍了一种利用自然语言处理和图论工具结合的方法,通过向量表示和多尺度社团检测技术对文本进行分析和分类,得出了一组组具有相似内容的文档,揭示了主题和子主题的类层次结构。