Feb, 2019

CN-Probase:面向大规模的中文分类体系构建的数据驱动方法

TL;DR本文提出了一种自动构建大规模高质量中文分类体系的方式 —— 从多个中国百科全书中提取 isA 关系,并通过三种启发式方法来验证。最终建立了精度约为 95% 的最大的中文分类体系 CN-Probase。