Sep, 2020

基于大规模数据集的实用中文依存句法分析器

TL;DR本研究介绍了 Baidu 依存分析器(DDParser),一个新的中文依存分析器,它是基于大规模手动标注数据集 ——Baidu 中文树库(DuCTB)训练的。DDParser 使用基于图的双仿射解析器,并对中文数据集的特征进行了调整,采用两个测试集测试,取得了 92.9%和 86.9%的标记连接分数(LAS),并取得了最先进的结果,并在 https URL 公开发布。