Nov, 2015

OntoSeg: 使用本体相似性的文本分割新方法

TL;DR本文提出了一种基于本体相似性的文本分割方法,使用 Hierarchical Agglomerative Clustering 算法生成一种树形分层结构,用于表征文本的概念结构,从而实现在不同粒度级别上的线性文本分割,实验证明该方法具有很高的分割质量。