Jul, 2016

利用世界知识作为文件聚类的间接监督

TL;DR该论文探讨了如何使用世界知识作为间接监督来帮助学习协议,并提供了一种利用世界知识进行领域相关文档聚类的示例,该方法通过消除实体和它们类型的歧义并将数据表示为异构信息网络的方式将世界知识适应于特定领域。作者采用两个现有的知识库作为他们的世界知识来源,在两个文本基准数据集上的实验结果表明,将世界知识作为间接监督的方法可以明显优于现有的聚类算法。