- 自动化易读文本分割
通过使用遮蔽和生成式语言模型以及组成句法分析,我们研究了自动 Easy Read 文本分割的新方法,并进行了自动化和人工评估,结果表明自动化 ER 分割的可行性以及与专家驱动的人工分割之间的差距。
- ACL跨语言和语法下预训练模型的评估
我们提出了一种评估多语言大型语言模型在多形式语法结构方面学习句法的方法,将分析转化为序列标记,通过选择几个语言模型并在 13 个多样化的依赖解析树库和 10 个成分解析树库上研究它们,结果表明:(i)该框架在多种编码上一致,(ii)预先训练 - 预训练语言模型的自监督和小样本解析
本文提出了 UPOA 和 UPIO 两种无监督的成分句法分析模型,其中 UPIO 利用内部关联和外部关联评分估计跨度的可能性,利用少量注释的树来学习更好的线性投影矩阵进行句法分析,实验表明,这两种方法都比之前的方法更有效。
- EMNLP不连续成分句法分析作为序列标注
本文将不连续的解析转化为序列标注,通过对输入序列进行近乎有序的排列来编码树的不连续性,研究了该表征是否可学习,并证明在正确的表征下,模型具有极高的速度和准确性。
- AAAI解析作为预训练
本文讨论了使用预训练架构(而非解码)进行单语种全刻度句法分析(成分和依赖)的问题,并使用序列标注作为模型,探讨了不同词向量的句法敏感性。实验分析显示,使用预训练编码器的结果优于现有序列标记解析器,F1 评分为 93.5%(PTB)和 78. - ACL更好、更快、更强的序列标注成分解析器
本文提出一种有效的方法来使 constituent parsing 更加准确,通过学习切换标记方案、降低标签集的稀疏性、并细化多任务学习以减少错误传播,加上辅助损失和策略梯度句子级微调等技术,成功优化了英文和中文 Penn Treebank - EMNLP自顶向下和自左向右移位归约成分句法分析的动态预言机
利用新颖的动态预测模型,提高基于转移的 shift-reduce 算法在成分句法分析中的准确率。其中,我们针对自顶向下和自内向外两种转移方式的解析器设计了动态预测模型,可以显著提高句法分析的准确率,达到了 92.0 F1 的最佳水平。
- EMNLP组成部分句法分析作为序列标注
该论文介绍了一种将成分解析简化为序列标注的方法,并使用该方法在 PTB 和 CTB 树库上取得了 90.7% 的 F1 得分,成为最快的成分解析器之一。
- COLING神经成分句法分析的两种本地化模型
本文研究了两种概念简单的本地神经模型,在成分分析中取得了高度竞争的结果,分别实现了 PTB 和 CTB5.1 中的标记支架 F1 得分为 92.4%和 87.3%。
- 非二叉的自底向上策略加速移位约简组成分析
该文章提出了一种新颖的非二元移进 - 规约算法用于组成句法分析,其比现有的基于移进 - 规约的组成句法分析系统使用更少的转换,成为最快的该类系统,以此加快下游任务的速度。该算法的准确性可以与当前最先进的基于移进 - 规约技术的组成句法分析器 - 编码器解码器移位归约句法分析
本研究针对基于转移的句法分析任务,探讨利用编解码神经网络进行建模的方法,并且取得了与当前最优方法相近的效果,同时在某些情况下表现更好。
- 神经预读特征的移进 - 规约成分句法分析
本文针对移位 - 归约分析的相对弱点,利用双向 LSTM 模型提取向前追望特征,并将结果传递给强大的过渡性成分分析器,提高了 1.3% 在 WSJ 和 2.3% 在 CTB 中的准确性。