基于 MRC 的跨度预测依存句法分析
我们提出了一种新的基于 headed spans 的投影依存解析方法。我们将从每个单词开始的最大子树表示为一组 headed spans,将一个依存树的得分分解为所有 headed spans 的得分, 并设计了一个新颖的 O (n3) 动态编程算法实现全局训练和准确推理。我们的方法在 PTB,CTB 和 UD 上实现了最先进或有竞争力的结果。
Aug, 2021
本文介绍了一种基于 label 和 span 独立评分的最小神经模型,并证明了该模型不仅与经典的动态规划技术兼容,而且还支持一种基于递归分割的新颖贪心自顶向下推理算法。经实验证明,两种预测方案竞争力强,并且与得分模型的基本扩展相结合,能够实现 Penn Treebank 的单模型最优性能(91.79 F1),并在法语 Treebank 上获得强大的性能(82.23 F1)。
May, 2017
本研究提出了一种使用远程监督形式的跨度约束技术来提高无监督语法分析性能的方法。通过少量跨度约束,可以大大提高无监督分析系统 DIORA 的性能。我们的实验表明,基于实体的跨度约束可以使英语 WSJ Penn Treebank 的组成分析提高超过 5 F1,并将其扩展到任何易于实现跨度约束的领域,同时在生物医学文本方面,该方法的有效性得到了证明。
Sep, 2021
该论文介绍了 Stanford 的 CoNLL 2018 UD 共享任务中的系统,这是一个完整的神经管道系统,可以将原始文本作为输入,并执行共享任务所需的所有任务,从分词和句子分割到词性标注和依赖关系解析,并通过广泛的消融研究展示了不同的模型组件的有效性。
Jan, 2019
通过引入 Universal Dependencies 中的句法特征,特别是句子内的句法关系和句子间的句法关系,从而建立一个跨语言的 Inter-Sentence 依存图,并提出了一个 ISDG 编码器,能在无需跨语言训练的情况下显著提高零 - shot 的性能。
Dec, 2021
通过使用基于图的方法,利用句法结构中的成分结构,包括语法树的长距离依赖和结构信息,实现了较强的代词消解技术。实验结果显示,在 OntoNotes 5.0 基准测试的英语和中文部分中,提出的模型要么超过了强基线要么实现了新的最高水平。
Feb, 2022
本研究结合了图形方法和基于主导跨度的方法,将弧度分数和主导跨度分数合并到模型中。通过两种动态规划算法组合第一和第二阶图形和主导跨度方法,实验表明,将基于第一阶图形的方法与基于主导跨度的方法相结合是有效的。但是,当组合第二阶图形和主导跨度方法时,我们观察到微弱或没有提高。
Aug, 2021
我们提出了一种新的成分分析模型,将分析问题转化为一系列指向任务,支持高效的自上而下编码和学习目标。实验表明,我们的方法在不使用预训练模型的情况下取得 92.78 F1 的结果,使用预训练 BERT,达到了 95.48 F1 和最先进的技术水平相当。此外,我们的方法也在多语种成分分析领域实现了最新的技术进展。
Jun, 2020
本研究提出了一种新的基于依存的混合树模型,将自然语言转换成机器可解释的含义表示,并通过在标准多语言 GeoQuery 数据集上进行的大量实验证明,我们的方法能够在多种语言上实现最先进的性能。
Sep, 2018