UCxn: 对通用依存结构之上的构式进行类型分析的标注
研究对比了 Universal Dependencies 和 Universal Morphology 计划,通过提出一种从 Universal Dependencies v2 特征映射到 UniMorph 结构的确定性映射,从而消除了两个项目之间的兼容性问题,并给出了两个注释项目的基础、优势和劣势的关键评估。
Oct, 2018
本文探讨了 Enhanced Universal Dependencies 中坐标结构的表示,通过创造一个大规模的数据集,手动编辑语法图,确定了应该在语义角度传播哪些依赖链接,比较了基于规则和基于机器学习的方法,并提出了一种基于神经图解析器的边缘预测器,超越了目前主要的基于基本层树解析器加转换器的流水线。
Mar, 2021
该研究介绍了 Universal Dependencies 的第二个版本,其中包括词汇分析、词形还原、标准化标记和句法关系,适用于 90 种语言,以及主要变化(UD v1 到 UD v2)的讨论。
Apr, 2020
本文介绍了一种使用构造语法概念来丰富语言表示的方法,该方法由一种基于使用的构造语法框架支持,通过提取具有辨别性的构造,然后利用关系超图注意网络获取构造信息的表示来增强语言表示,实验结果表明该模型在各种自然语言理解任务方面具有明显优势。
Jun, 2023
通过在不同语言之间建立语义和句法的通用连接,并利用跨语言的并行句法结构,我们引入了 UD Type Calculus—— 一种构成性、有原则且与语言无关的语义类型和逻辑形式系统。我们解释了 UD Type Calculus 的基本特征,这些特征都涉及将依赖关系的意义如同单词的意义一样进行指称。这些特征使得 UD-TC 能够通过使用依赖标签来准确地推导出各种句法结构的正确含义。最后,我们在一个大型现有语料库上展示了 UD-TC 的评估结果,证明它能够产生与我们的基准结果相媲美的意义。
Mar, 2024
本文介绍和评估了不同的方法将 Stanford Typed Dependencies (SD) 和 Penn-style 组分树的黄金标准语料库数据转化为最新的英语通用依赖关系 (UD2.2)。结果表明,多种语体下,纯 SD 到 UD 的转换具有高精度,只有 1.5% 的错误率,但如果访问纯语法树之外的注释,如实体类型和指代消解这样的注释,可以进一步提高精度,错误率可以降至不到 0.5%。我们表明,基于成分的转换使用 CoreNLP (自动命名实体识别) 在所有语体中表现不佳,包括在使用黄金成分树时,主要是由于短语语法功能的不充分规范化。
Sep, 2019
本文介绍了用 Universal Dependencies 分析 Tweets 的问题,提出了扩展 UD 指南来覆盖 Tweets 中的特殊结构以及使用新的 Tweet Treebank v2 来解决标注中的歧义,并构建了一个可以将原始 Tweets 解析为 UD 的流水线系统。此外,作者还提出了一种新的方法来精简基于转换的解析器的集合,并在真实情况下验证了该方法的有效性。
Apr, 2018
本研究探讨了多种模型构型,借助通用分解语义数据(UDS)集中丰富的句法和语义注释,联合解析通用依赖和 UDS,以获得两种形式主义的最新结果,同时分析了句法和语义联合模型的行为。我们还研究了联合建模在多语言环境下的普适性,并发现了 8 种语言中相似的趋势。
Apr, 2021
本文旨在通过对多种深层句法框架的分析,提出一组通用的语义角色标签建议,并将其应用于语言数据。建议基于多种理论语言观点,主要聚焦于 Meaning-Text Theory 和 Functional Generative Description 框架。数据来自西班牙语、加泰罗尼亚语、捷克语和英语。建议旨在面向 Universal Dependencies,并将通用语义角色标签用于 UD 数据。
Mar, 2023
本研究讨论了当前 Universal Dependencies 在日语依存句法分析中使用 Short Unit Words 作为基础单元的问题,提出其并非传统意义上的句法单词,探讨采用其作为标注准则的成本和收益。
Jun, 2019