UCxn: 对通用依存结构之上的构式进行类型分析的标注

COLINGMar, 2024

UCxn: 对通用依存结构之上的构式进行类型分析的标注

UCxn: Typologically Informed Annotation of Constructions Atop Universal Dependencies

Leonie Weissweiler, Nina Böbel, Kirian Guiller, Santiago Herrera, Wesley Scivetti...

TL;DR通过在 UD 注释上加入一个 'UCxn' 注释层并且在典型性知识的指导下，我们将构建类型说法可以跨语言进行比较的 UD 注释，同时为未来的 UD 树库提供了建设的基础。

Abstract

The universal dependencies (UD) project has created an invaluable collection of treebanks with contributions in over 140 languages. However, the UD annotations do not tell the full story. grammatical constructions

universal dependencies ud annotations grammatical constructions morphosyntactic elements construction families

发现论文，激发创造

通用依赖和通用形态的融合

研究对比了 Universal Dependencies 和 Universal Morphology 计划，通过提出一种从 Universal Dependencies v2 特征映射到 UniMorph 结构的确定性映射，从而消除了两个项目之间的兼容性问题，并给出了两个注释项目的基础、优势和劣势的关键评估。

Oct, 2018

英语增强型通用依存语法中协同结构的分析与计算建模

本文探讨了 Enhanced Universal Dependencies 中坐标结构的表示，通过创造一个大规模的数据集，手动编辑语法图，确定了应该在语义角度传播哪些依赖链接，比较了基于规则和基于机器学习的方法，并提出了一种基于神经图解析器的边缘预测器，超越了目前主要的基于基本层树解析器加转换器的流水线。

Mar, 2021

通用依存关系 v2：一个不断增长的多语言树库集合

该研究介绍了 Universal Dependencies 的第二个版本，其中包括词汇分析、词形还原、标准化标记和句法关系，适用于 90 种语言，以及主要变化（UD v1 到 UD v2）的讨论。

Apr, 2020

利用结构信息增强语言表示以提升自然语言理解能力

本文介绍了一种使用构造语法概念来丰富语言表示的方法，该方法由一种基于使用的构造语法框架支持，通过提取具有辨别性的构造，然后利用关系超图注意网络获取构造信息的表示来增强语言表示，实验结果表明该模型在各种自然语言理解任务方面具有明显优势。

Jun, 2023

通用依存句法的组合类型语义

通过在不同语言之间建立语义和句法的通用连接，并利用跨语言的并行句法结构，我们引入了 UD Type Calculus—— 一种构成性、有原则且与语言无关的语义类型和逻辑形式系统。我们解释了 UD Type Calculus 的基本特征，这些特征都涉及将依赖关系的意义如同单词的意义一样进行指称。这些特征使得 UD-TC 能够通过使用依赖标签来准确地推导出各种句法结构的正确含义。最后，我们在一个大型现有语料库上展示了 UD-TC 的评估结果，证明它能够产生与我们的基准结果相媲美的意义。

Mar, 2024

从斯坦福和宾州树库到英语通用依存关系的多层注释转换

本文介绍和评估了不同的方法将 Stanford Typed Dependencies (SD) 和 Penn-style 组分树的黄金标准语料库数据转化为最新的英语通用依赖关系 (UD2.2)。结果表明，多种语体下，纯 SD 到 UD 的转换具有高精度，只有 1.5% 的错误率，但如果访问纯语法树之外的注释，如实体类型和指代消解这样的注释，可以进一步提高精度，错误率可以降至不到 0.5%。我们表明，基于成分的转换使用 CoreNLP (自动命名实体识别) 在所有语体中表现不佳，包括在使用黄金成分树时，主要是由于短语语法功能的不充分规范化。

Sep, 2019

将推文解析为通用依存关系

本文介绍了用 Universal Dependencies 分析 Tweets 的问题，提出了扩展 UD 指南来覆盖 Tweets 中的特殊结构以及使用新的 Tweet Treebank v2 来解决标注中的歧义，并构建了一个可以将原始 Tweets 解析为 UD 的流水线系统。此外，作者还提出了一种新的方法来精简基于转换的解析器的集合，并在真实情况下验证了该方法的有效性。

Apr, 2018

联合通用句法语义分析

本研究探讨了多种模型构型，借助通用分解语义数据（UDS）集中丰富的句法和语义注释，联合解析通用依赖和 UDS，以获得两种形式主义的最新结果，同时分析了句法和语义联合模型的行为。我们还研究了联合建模在多语言环境下的普适性，并发现了 8 种语言中相似的趋势。

Apr, 2021

深度句法关系的统一分类

本文旨在通过对多种深层句法框架的分析，提出一组通用的语义角色标签建议，并将其应用于语言数据。建议基于多种理论语言观点，主要聚焦于 Meaning-Text Theory 和 Functional Generative Description 框架。数据来自西班牙语、加泰罗尼亚语、捷克语和英语。建议旨在面向 Universal Dependencies，并将通用语义角色标签用于 UD 数据。

Mar, 2023

关于日语单词的定义

本研究讨论了当前 Universal Dependencies 在日语依存句法分析中使用 Short Unit Words 作为基础单元的问题，提出其并非传统意义上的句法单词，探讨采用其作为标注准则的成本和收益。

Jun, 2019