宾州树库中的协调标注扩展
基于神经网络的模型用于协调边界预测,通过多个 LSTM 网络,并在 Treebank 上进行训练,展示了与两个现有技术的比较,以及在 Genia 语料库上的改进。
Oct, 2016
本文介绍了一种过渡式气泡分析器以同时执行协调结构识别和基于依赖的句法分析。基于气泡的结构可以通过编码协调边界和协调结构内部关系来增强依赖树,我们引入了一种过渡系统和神经模型用于解析这些增强型结构。在对英语 Penn Treebank 和英语 GENIA 语料库的实验结果表明,我们的解析器在协调结构预测任务上击败了以前的最先进方法,尤其是在具有复杂协调结构的子句中的表现更佳。
Jul, 2021
本文探讨了 Enhanced Universal Dependencies 中坐标结构的表示,通过创造一个大规模的数据集,手动编辑语法图,确定了应该在语义角度传播哪些依赖链接,比较了基于规则和基于机器学习的方法,并提出了一种基于神经图解析器的边缘预测器,超越了目前主要的基于基本层树解析器加转换器的流水线。
Mar, 2021
我们提出了一个名为 COordination RECognizer (CoRec) 的流水线模型,用于解决协调识别任务的挑战,该模型包含两个组件:协调识别器和从句边界检测器,并在来自各个领域的数据集上进行实验,证明了该方法的有效性和效率,进一步实验证明 CoRec 对于下游任务有积极影响,提高了最先进的 Open IE 模型的产出。
Nov, 2023
研究了神经语言模型代表短语级别特征的能力,使用协调名词短语作为研究案例,发现模型使用 NP 成分数量的线性组合来驱动 CoordNP/verb 数量协议。模型在性别协议方面成功较少。使用大型语料库训练的模型表现最佳,并且使用显式句法监督训练的模型没有明显的优势。
Sep, 2019
通过在 UD 注释上加入一个 'UCxn' 注释层并且在典型性知识的指导下,我们将构建类型说法可以跨语言进行比较的 UD 注释,同时为未来的 UD 树库提供了建设的基础。
Mar, 2024
本文提出了一种用于自动检测依赖解析语料库中注释不匹配的方法,以及三种自动转换注释不匹配的方法,并通过重新训练两种依赖解析器的实验证明应用这些方法可以明显地提高性能。
Jan, 2022
研究了人类句法注释的两个关键特性:基于锚定和协议,通过 Penn Treebank WSJ 中的例句系统地获得英语依赖解析器的间注者一致性估计。发现锚定效应对人类编辑语法资源的创建有负面影响,并且通过该方法获得的语法注释质量低于基于人类的注释。
May, 2016