ACLJan, 2021

Trankit:用于多语言自然语言处理的轻量级基于 Transformer 的工具包

TL;DRTrankit 是一个轻量级的基于 Transformer 的工具包,提供了一个可训练的多语言 NLP 任务流水线,支持 100 多种语言,以及 56 种语言的 90 个预训练流水线,可用于句子分割、词性标注、形态特征标注、依存分析等任务,同时保持了 90 种通用依存树库中的标记化、多词标记展开和词形归并的竞争性表现。