Jun, 2020

布拉格依存数学树库 -- 集成版本 1.0

TL;DR我们提出了一种丰富注释的语言资源,即Prague Dependency Treebank-Consolidated 1.0(PDT-C 1.0),其中包含四个来自不同来源的捷克文数据集,可供自然语言处理任务和语言学研究使用,总共包含约18万句带有它们的词态、表面和深层语法标注,可供比较不同流派文本的跨语言研究。