May, 2022

研究文章集的主题划分

TL;DR该论文通过对网络上论文数据的主题分割,构建出一个包含七百万篇文献数据的多主题数据集,并创建出一套主题分类体系以注释每篇论文的主题归属,从而可以将其作为既包含各学科领域文献数据的异构文献资源集,又可分割为单一研究领域所对应的同质文献集的多主题数据集。