利用 Trace 进行分析:一个 $O (n^4)$ 算法和结构化表示
提出了一种用于跨度句法分析的基于图表的新算法,可以处理块度为 2 的不连续依存树,包括病态嵌套结构,在时间复杂度为 O (n^(6~3)) 之间构建其变异版本,并在德语和英语树库上评估其性能,包括预先训练的词嵌入和基于 BERT 的神经网络。
Mar, 2020
本文使用 Shen 等人 (2018) 的句法分析算法来恢复基于 “句法深度” 代理的短语结构树,并使用常规 LSTM 语言模型提供的代理进行比较,发现偏向于右分支结构的解析算法可以夸大语言模型的表现能力。
Sep, 2019
本文提出了一种新的基于图的方法来进行语义解析,解决了文献中观察到的两个问题:(1) seq2seq 模型无法完成组合泛化任务;(2) 使用短语结构解析器的先前工作无法涵盖树库中观察到的所有语义解析。我们证明了两个优化算法的正确性,用基于约束平滑和条件渐变的方法近似解决这些推断问题。实验证明,我们的方法在 Geoquery、Scan 和 Clevr 上都具有最先进的效果,包括在测试组合泛化的过程中。
Feb, 2023
通过使用一种新的过渡系统,将存储子树的方法改为带有常数时间随机访问的解析项集合,设计了一种能够在 4n-2 次转换中完成长度为 n 的任何不连续成分树构建的解析策略,同时引入了一个可靠的动态预测器用于该过渡系统,并在三个英语和德语的不连续成分分析树库上实现了最先进的结果。
Apr, 2019
通过结构化感知机训练和使用大量自动解析的句子来学习神经网络表示,我们的解析器在 Penn Treebank 数据集上达到了 94.26%的未标记和 92.41%的标记附加精度,是迄今为止在 Stanford Dependencies 上最佳的精度,并提供深入的剖析分析以确定模型的哪些方面提供了最大的准确性增益。
Jun, 2015
该研究提出了一种基于最小生成树的推断算法,可以将大规模的图形依赖分析模型边缘数量的运行时间复杂度降至 O (m),并通过局部贪心更新进一步优化了有向解析树模型,验证实验表明,该算法在 18 种语言的测试中表现类似于原始解析器。
Oct, 2015
本文提出了一种新的中间表示法,基于这种表示法,我们将短语表示分析转化为依存分析,并通过在依存标签中编码顺序信息,表明任何可训练的依存分析器都可以用来生成 constituents。尽管我们的方法很简单,但实验证明,结果与强基准线(例如伯克利解析器和 SPMRL 2014 共享任务中最好的单一系统)不相上下,特别是在德语断点解析方面,我们超过了当前的技术水平。
Feb, 2015
直接依赖语音信号的句法分析被提出作为一种任务,该任务旨在将韵律信息纳入分析系统并绕过使用自动语音识别系统和句法分析器的管道方法的局限性。本文报告了一系列实验,旨在评估两种句法分析范式(基于图的分析和基于序列标注的分析)在语音分析中的性能。我们在一大型的法语口语树库上进行了评估,其中包含真实的自发对话。我们的研究结果表明,(i)基于图的方法在整体上获得了更好的结果,(ii)直接从语音中进行分析优于管道方法,尽管参数量少了 30%。
Jun, 2024
提出了一种基于转换的方法,通过训练单个模型,可以有效地解析任何输入句子,支持连续 / 投影和不连续 / 非投影的句法结构,并证明了这两种句法形式可以在训练过程中互相受益,提高了在多个基准测试中的准确性,如英语和中文 Penn 树库以及德语 NEGRA 和 TIGER 数据集。
Sep, 2020
提出了一种基于 RNNs 和动态规划的图结构堆叠和波束搜索的线性时间组成成分句法分析器,通过集成立方剪枝,可以将其运行速度进一步提高到 O(n b log b),相对于图表解析基线,此线性时间解析器在长句子上的速度明显更快,对于话语分析来说速度更快,是单模型端到端系统中在 Penn Treebank 上达到的最高 F1 准确度。
May, 2018