COMBO: 一种新的 EUD 解析模块
FASTPARSE 团队针对 IWPT2020 的 EUD Shared Task 提出一种训练和推理效率结合的模型,结合神经依存解析和基于规则的系统,将 UD 树映射为 EUD 图,在官方提交中获得 74.04 的平均 ELAS,排名第 4。
Jun, 2020
COMBO 是一个完全基于神经网络的 NLP 系统,支持准确的词性标注、形态分析、词形还原和 (增强) 依赖分析,提供超过 40 种语言的自动可下载的预训练模型,平衡了效率和质量。
Sep, 2021
该论文介绍了 ADAPT 系统参加 2020 年 IWPT 共享任务的解析增强通用依存关系的方法,采用 UDPipe 和 UDPipe-future 构建管道方法,使用语义依存图解析器或一系列启发式规则来增强依存图,并在语言平均值方面达到了 79.53 分,可以成功实现增强依赖句法分析任务。
Sep, 2020
本文探讨了 Enhanced Universal Dependencies 中坐标结构的表示,通过创造一个大规模的数据集,手动编辑语法图,确定了应该在语义角度传播哪些依赖链接,比较了基于规则和基于机器学习的方法,并提出了一种基于神经图解析器的边缘预测器,超越了目前主要的基于基本层树解析器加转换器的流水线。
Mar, 2021
本文描述了我们的系统(HIT-SCIR),该系统提交给 CoNLL 2018 共享任务,涉及从原始文本到通用依赖的多语言解析。我们基于斯坦福的获胜系统进行提交和进行了两个有效的扩展:1)将深度上下文化词嵌入到词性标记器和解析器中;2)集合使用不同初始化的解析器进行训练。我们还探索了不同的合并树库的方法以进行进一步的改进。开发数据上的实验结果显示了我们方法的有效性。在最后的评估中,我们的系统在 LAS(75.84%)上排名第一,并大幅跑赢了其他系统。
Jul, 2018
UDify 是一个多语言多任务模型,可以准确预测 75 种语言中 124 个通用依赖树库的通用词性、形态特征、词形和依赖树,无需任何循环或语言特定组件,并且在跨语言注释方面对低资源语言起到关键作用,并且可以进行零 - shot 学习。
Apr, 2019
该论文提出了一种基于图的解析器系统,并使用二阶推理方法。我们在低资源的泰米尔语语料库中,将泰米尔语的训练数据与其他语言混合使用,显著提高了泰米尔语的性能。尽管我们之前提交了未连接的图,导致在 10 个团队中只排名第六,但我们解决这个问题后,我们的系统比官方排名第一的团队高出 0.6 ELAS。
Jun, 2020
该论文介绍了 Stanford 的 CoNLL 2018 UD 共享任务中的系统,这是一个完整的神经管道系统,可以将原始文本作为输入,并执行共享任务所需的所有任务,从分词和句子分割到词性标注和依赖关系解析,并通过广泛的消融研究展示了不同的模型组件的有效性。
Jan, 2019
该研究介绍了 Universal Dependencies 的第二个版本,其中包括词汇分析、词形还原、标准化标记和句法关系,适用于 90 种语言,以及主要变化(UD v1 到 UD v2)的讨论。
Apr, 2020