- ACLHexatagging: 投影依存句法分析作为标记化
本文介绍了一种新的依赖性分析器:Hexatagger,通过标记句子中的单词,并使用可能标记的有限集合来构建依赖关系树。我们的方法是完全可并行化的,并获得了 96.4 LAS 和 97.4 UAS 的最新性能。同时,我们的解析器的线性时间复杂 - 反映土耳其语聚合性质的 BOUN 语料库的增强
本研究旨在通过引入新的注释约定来解决土耳其语在 BOUN Treebank 中的空态词素、高度生产的派生过程和混合词素等问题,并基于新注释的数据集进行了依赖关系分析和工具更新。
- ACL神经依存句法分析的高效二阶 TreeCRF
本文在深度学习时代,首次提出将二阶 TreeCRF 扩展到 biaffine 句法分析器,通过 27 个数据集的实验和分析,显示出在部分有标记训练数据的情况下,表现结构学习(全局 TreeCRF 损失)和高阶建模依然有用,可以进一步提高句法 - EMNLP中文语义角色标注的句法感知多任务学习框架
本文介绍了基于统一覆盖模型的跨度和基于单词的语义角色标注,并提出了一种多任务学习框架,其中包括基本 SRL 模块和依赖性解析器模块,通过该框架,我们使用外部句法表示得到了新的最先进的中文 SRL 良好结果。
- ACL带有句法感知词表示的句法增强神经机器翻译
本研究提出了一种基于依赖解析器的隐式语法表示方法,通过使用中间隐藏的依赖解析器表示来增强基础神经机器翻译模型,可以在中英文和英越翻译任务的基准数据集上显著提高 BLEU 打分表现,并超过了显式树状 RNN 和线性化方法。
- ACL使用异构树库进行的解析器训练
本文提出了一种基于树库嵌入的新方法,以改进现有多种树库的依存关系分析器,实验证明这种方法相比于现有的许多策略要好,可以大大提高自然语言处理中的性能
- 从 CommonCrawl 构建 Web 规模的依赖解析语料库
介绍了 DepCC,这是迄今为止最大的英文语言分析语料库,包括 365 万份文档,由 Common Crawl 项目的 2520 亿个符记和 75 亿个命名实体出现组成,可以通过一些应用程序使用,例如基于句法的词嵌入训练,信息提取和问题回答 - ACL适用于不受限非投影句法分析的完整非单调转换系统
本文提出了一种基于 Covington 算法的全非单调转移系统,并开发了几种非单调变体的动态预测器,从而探索训练过程中的错误操作。在 CoNLL-X 和 CoNLL-XI 共享任务的数据集上进行实验,实验结果显示,非单调的动态预测器在大部分 - 越南依赖解析的实证研究
本文比较了不同的依赖关系解析器对于越南语的表现,实验结果显示基于神经网络的解析器显著优于传统解析器,在标注和未标注附着得分上分别达到了 73.53% 和 80.66%,是目前公布的越南语最高的解析得分。
- 有限资源下的跨语言句法转移
本文提出了一种简单而有效的方法,可以在没有大量翻译数据的情况下进行跨语言的句法转移,这种方法基于三个步骤:1)推导跨语言单词簇的方法,可用于多语言解析器;2)将目标语言的词汇信息转移到源语言树库;3)将这些步骤与 Rasooli 和 Col - 一次性读取、标记和解析,或完全神经依存句法分析
用单个深度神经网络实现的依赖关系解析器,无需词性标注即可直接生成依存关系及其标签,经过多任务学习和适当的正则化和额外监督训练,在没有语言特征的情况下,在斯拉夫语 UD 树库中表现为最高准确性。
- 使用分层树 LSTM 进行简单优先级依赖解析
本文提出了一种基于递归组合的循环神经网络编码器的分析树组合向量表示方法,将其作为贪心自底向上的依赖关系分析器的骨干,无需外部词嵌入,实现了英语和中文的最新精度。
- Yara Parser: 一个快速准确的依存句法分析器
介绍了 Yara Parser,它是一种基于 arc-eager 算法和 beam 搜索的快速准确的开源依赖分析器,在自然语言处理中有许多重要的应用,具有可扩展性和可调节性。
- 学习搜索依赖关系
本文提出使用 credit assignment compiler 构建依存句法分析器,消除底层机器学习细节带来的负担。该方法得到了一个简单的解析器,可以应用于多种语言,并具有与最先进的基于转换的解析方法相似的统计和计算性能,同时避免了各种