依赖句法分析中的句法核心 -- 多语言探索
本研究提出了一种新的基于神经网络的两种表征形式(span 和 dependency)的句法和语义联合模型,该模型有效地整合了句法信息,最大化优化联合目标,试验结果表明语义和句法可以相互促进,以全新的表现水平取得了 Propbank 基准测试集上的最好成绩。
Aug, 2019
通过依存句法分析技术,我们在低资源语言乌尔都语的解析中取得了重要进展,并使用复杂的特征模型和 Nivreeager 算法,获得了一定准确率并评估了解析器的错误。
Jun, 2024
本研究提出了一种新的基于依存的混合树模型,将自然语言转换成机器可解释的含义表示,并通过在标准多语言 GeoQuery 数据集上进行的大量实验证明,我们的方法能够在多种语言上实现最先进的性能。
Sep, 2018
我们提出了一种评估多语言大型语言模型在多形式语法结构方面学习句法的方法,将分析转化为序列标记,通过选择几个语言模型并在 13 个多样化的依赖解析树库和 10 个成分解析树库上研究它们,结果表明:(i)该框架在多种编码上一致,(ii)预先训练的词向量不偏好成分句法表示,而是倾向于依赖表示,(iii)子词标记化需要用于表示语法,与基于字符的模型不同,(iv)从词向量中恢复语法时,语言在预训练数据中的出现比任务数据的数量更重要。
Sep, 2023
该论文介绍了 Stanford 的 CoNLL 2018 UD 共享任务中的系统,这是一个完整的神经管道系统,可以将原始文本作为输入,并执行共享任务所需的所有任务,从分词和句子分割到词性标注和依赖关系解析,并通过广泛的消融研究展示了不同的模型组件的有效性。
Jan, 2019
使用多语言模型进行依赖解析,通过使用多语言单词聚类和嵌入,令解析器能够在多种语言中进行有效解析,同时基于语言普遍规律和类型相似性实现跨语言推断,从而使其能够更有效地从有限的注释中进行学习。
Feb, 2016
本研究探讨了多种模型构型,借助通用分解语义数据(UDS)集中丰富的句法和语义注释,联合解析通用依赖和 UDS,以获得两种形式主义的最新结果,同时分析了句法和语义联合模型的行为。我们还研究了联合建模在多语言环境下的普适性,并发现了 8 种语言中相似的趋势。
Apr, 2021
本文提出一种新的 O (n^3) 依赖语法分析算法,并开发了三种不同的随机化方式。我们提出了词汇亲和模型、意义标注模型和生成模型。通过在训练文本上评估三种模型的分析性能并给出了初步的实证结果,其中生成模型在分析性能上表现显著优于其他模型,并且在词性标注方面表现同样出色。
Jun, 1997
本文提出一种语言模型,其利用句法结构从单词历史中提取有意义的信息,实现了远距离依赖关系的利用。该模型为每个单词序列 - 二元分析结构分配概率加以注解,同时提出了概率参数化和一组评估其预测力的实验。
Nov, 1998