我们定义了从自左向右读取句子的基于转移的解析算法到序列标注编码的句法树的映射。这不仅建立了基于转移的解析和序列标注解析之间的理论关系,而且提供了一种从不同形式的现有基于转移的解析器中获得快速简单的序列标注解析的新编码的方法。将其应用于依赖分析,我们实现了四种算法的序列标注版本,结果显示它们是可学习的,并且具有与现有编码相当的性能。
Nov, 2020
使用双向 LSTM 神经网络构建特征向量,在依存句法分析中实现最新的结果。
Mar, 2016
该论文介绍了一种将成分解析简化为序列标注的方法,并使用该方法在 PTB 和 CTB 树库上取得了 90.7% 的 F1 得分,成为最快的成分解析器之一。
Oct, 2018
该研究论文探讨了基于现代架构的全面增量依存解析是否能够具备竞争力,并建立了将严格的从左到右神经编码器与全面增量序列标注和基于转换的解码器相结合的解析器。结果表明,基于现代架构的全面增量解析远远落后于双向解析,并注意到语言学上合理解析的挑战。
Sep, 2023
通过使用通用的基于 Bi-LSTM 的神经序列标注模型,其应用于广泛的自然语言处理任务和语言,结合从数据中提取的形态、语义和结构提示信息以进行有根据的预测,本研究在 8 个基准数据集上对其性能进行了评估,其结果在 4 个数据集上取得了最佳的表现。
Aug, 2018
本文将解析问题作为多任务学习来探究,通过添加解析范式作为辅助损失,在其他范式表现中保持一致提高性能,探讨了一种 MTL 序列标记模型,以几乎不损失性能和速度的代价解析两个表示,总体结果表明,平均来说,具有属于成分解析的辅助损失的 MTL 模型比单任务模型高 1.14 F1 点,而用于依赖解析的辅助损失提升 0.62 UAS 点。
Jul, 2019
该文提出了一种新的序列到序列神经网络控制结构 —— 堆栈 LSTM,用于学习过渡式依赖解析器的解析状态,将其应用于解析模型中,实现了解析器状态的三个方面,提高了解析性能。
May, 2015
本文讨论了使用预训练架构(而非解码)进行单语种全刻度句法分析(成分和依赖)的问题,并使用序列标注作为模型,探讨了不同词向量的句法敏感性。实验分析显示,使用预训练编码器的结果优于现有序列标记解析器,F1 评分为 93.5%(PTB)和 78.8%(EN-EWT UD)的限制条件下。
Feb, 2020
本文提出了一种基于递归组合的循环神经网络编码器的分析树组合向量表示方法,将其作为贪心自底向上的依赖关系分析器的骨干,无需外部词嵌入,实现了英语和中文的最新精度。
本文针对英文和中文的语义角色标注进行了实证分析,并通过联合标签的转换方案,将 SRL 注释打包至依存树表示中,并证明该表示法有望进一步将句法方法结合到语义角色标注中。
Oct, 2020