constituency parsing is a fundamental and important task for natural language
understanding, where a good representation of contextual information can help
this task. n-grams, which is a conventional type of feat
我们提出了一种新的成分分析模型,将分析问题转化为一系列指向任务,支持高效的自上而下编码和学习目标。实验表明,我们的方法在不使用预训练模型的情况下取得 92.78 F1 的结果,使用预训练 BERT,达到了 95.48 F1 和最先进的技术水平相当。此外,我们的方法也在多语种成分分析领域实现了最新的技术进展。
提出了一种基于 RNNs 和动态规划的图结构堆叠和波束搜索的线性时间组成成分句法分析器,通过集成立方剪枝,可以将其运行速度进一步提高到 O(n b log b),相对于图表解析基线,此线性时间解析器在长句子上的速度明显更快,对于话语分析来说速度更快,是单模型端到端系统中在 Penn Treebank 上达到的最高 F1 准确度。