本文针对依存句法计算模型存在的偏差进行了探究,发现现有的基于生成树的推理算法在面向依存树的推理过程中表现不佳,作者提出两种不带替换和带替换样本采样的算法来解决此问题,并提出了两种算法来减小样本数量 k 的算法运行时的时间复杂度至 O(kn3)。
May, 2022
DepProbe 是一个能够从嵌入中提取有标签和有向依赖解析树的线性探针,使用的参数较少,计算复杂度较低,并且在选择最佳转移语言以训练完整的双仿效注意解析器方面表现卓越。
Mar, 2022
该研究提出了一种基于最小生成树的推断算法,可以将大规模的图形依赖分析模型边缘数量的运行时间复杂度降至 O (m),并通过局部贪心更新进一步优化了有向解析树模型,验证实验表明,该算法在 18 种语言的测试中表现类似于原始解析器。
Oct, 2015
直接依赖语音信号的句法分析被提出作为一种任务,该任务旨在将韵律信息纳入分析系统并绕过使用自动语音识别系统和句法分析器的管道方法的局限性。本文报告了一系列实验,旨在评估两种句法分析范式(基于图的分析和基于序列标注的分析)在语音分析中的性能。我们在一大型的法语口语树库上进行了评估,其中包含真实的自发对话。我们的研究结果表明,(i)基于图的方法在整体上获得了更好的结果,(ii)直接从语音中进行分析优于管道方法,尽管参数量少了 30%。
Jun, 2024
本文提出了一种新的中间表示法,基于这种表示法,我们将短语表示分析转化为依存分析,并通过在依存标签中编码顺序信息,表明任何可训练的依存分析器都可以用来生成 constituents。尽管我们的方法很简单,但实验证明,结果与强基准线(例如伯克利解析器和 SPMRL 2014 共享任务中最好的单一系统)不相上下,特别是在德语断点解析方面,我们超过了当前的技术水平。
Feb, 2015
本文提出了一种能够同时进行全局特征提取和线性时间推理的依存句法分析模型,支持投影和非投影句子的解析,经检验表现良好。
Nov, 2019
该研究提供基于依赖树的文本增强技术,包括剪裁和旋转,用于增加低资源语言数据集的大小,在词性标注任务中提高了大多数语言的精度。
Mar, 2019
本研究提出了一种新的基于依存的混合树模型,将自然语言转换成机器可解释的含义表示,并通过在标准多语言 GeoQuery 数据集上进行的大量实验证明,我们的方法能够在多种语言上实现最先进的性能。
Sep, 2018
该论文探究了加入不同语言结构对神经机器翻译性能的影响,提出了一种能够自然生成目标端任意树形结构的神经机器翻译模型,并且发现无需任何语言知识构造的平衡二叉树结构具有最佳的性能提升,能够超过标准的 seq2seq 模型和其他引入目标端语法的方法,提高 2.1 个 BLEU 分数。
Aug, 2018
本文使用 Shen 等人 (2018) 的句法分析算法来恢复基于 “句法深度” 代理的短语结构树,并使用常规 LSTM 语言模型提供的代理进行比较,发现偏向于右分支结构的解析算法可以夸大语言模型的表现能力。
Sep, 2019