使用指针网络重排序将不连续转换为连续解析
通过 Pointer Networks,我们提出了一种新的神经网络架构,可以生成到目前为止最准确的不连续成分表示,即使不需要词性标注信息,此方法在 NEGRA 和 TIGER 基准测试中均取得了最新的最优结果。
Feb, 2020
提出了一种基于转换的方法,通过训练单个模型,可以有效地解析任何输入句子,支持连续 / 投影和不连续 / 非投影的句法结构,并证明了这两种句法形式可以在训练过程中互相受益,提高了在多个基准测试中的准确性,如英语和中文 Penn 树库以及德语 NEGRA 和 TIGER 数据集。
Sep, 2020
通过使用 pointer networks 实现的转移句法分析器在依赖句法分析方面已经成为最新的技术水平,我们提出了一种基于指针网络的转移系统,可以直接生成标记有方向无环图并实现语义依赖分析。同时,我们使用从 BERT 提取的深层上下文化的词嵌入来增强我们的方法。这一结果不仅超越了所有现有的基于转移的模型,而且还匹配了 SemEval 2015 任务 18 英语数据集上先前最先进的基于图形的解析器的最佳完全监督准确率。
May, 2020
提出了一种新颖的基于转移的算法,采用指针网络框架,从左到右直接将句子解析为 $n$ 个附加部分,避免使用原始的自上而下堆栈指针解析器,并将转换序列长度减半,得到了一个二次非投影解析器,在完全监督单模型依赖解析器中取得了迄今最好的准确度,并在大多数语言测试中改进了以前的自上而下转移系统。
Mar, 2019
本文提出了一种新的中间表示法,基于这种表示法,我们将短语表示分析转化为依存分析,并通过在依存标签中编码顺序信息,表明任何可训练的依存分析器都可以用来生成 constituents。尽管我们的方法很简单,但实验证明,结果与强基准线(例如伯克利解析器和 SPMRL 2014 共享任务中最好的单一系统)不相上下,特别是在德语断点解析方面,我们超过了当前的技术水平。
Feb, 2015
通过使用一种新的过渡系统,将存储子树的方法改为带有常数时间随机访问的解析项集合,设计了一种能够在 4n-2 次转换中完成长度为 n 的任何不连续成分树构建的解析策略,同时引入了一个可靠的动态预测器用于该过渡系统,并在三个英语和德语的不连续成分分析树库上实现了最先进的结果。
Apr, 2019
本研究提出了一种新的依存句法分析架构:堆栈指针网络(StackPtr),它将指针网络与内部堆栈相结合,在整个句子上首先进行读取和编码,然后以自顶向下(从根到叶)的深度优先方式构建依存树,生成任何(包括非投影)解析树的步骤数与其他基于转换的解析器一样,在句子长度中是线性的。在 29 个树库方面进行评估,跨越 20 种语言和不同的依赖注释模式,并在其中 21 个方面实现最先进的性能表现。
May, 2018
本研究比较基于词汇化和非词汇化的句法分析模型的性能表现,提出了一种基于结构 - 标签转换系统和双向 LSTM 评分系统的非词汇化转换型分析器,结果表明非词汇化模型在处理不连续组分句法结构时具有更好的性能表现,尤其是在英语和德语的领域中。
Feb, 2019
我们提出了一种新的集成方法来处理无监督的不连续句法分析问题,通过对现有的不连续解析器的多次运行进行平均预测,稳定并提升性能。同时,我们还提供了对于不同二进制和连续性设置下的树平均的综合计算复杂性分析,以及一种高效的精确算法来解决这个任务,实验结果表明我们的方法在三个数据集上优于所有基准,并对我们的方法进行了深入分析。
Feb, 2024