- ACLjp-evalb: 基于对齐的强健 PARSEVAL 测量
我们引入了一个评估系统,用于计算 PARSEVAL 度量,提供了一种可行的方法来评估组成分析的准确性,而不需要一致的分词和句子边界。相反,我们的方法基于一种对齐方法,名为 jp-evalb,它在不一致时对齐句子和单词,旨在克服与 evalb - 大型语言模型的多阶段协作知识蒸馏
我们提出了一种多阶段协同知识蒸馏方法,用于稀缺标记数据的半监督序列预测任务,通过从提示的大型语言模型中蒸馏出的学生模型,在特定任务上能够更好地泛化,且在两个句法分析任务上表现出了优势。
- 基于 LLMs 的短语结构解析
运用大型语言模型探索生成线性化树解决成分句法分析任务,并通过实验证明模型的性能、泛化能力和挑战。
- 跨语言中高古德语语法句法分析:基于非词汇化方法
本研究旨在通过使用去词法化方法,利用现代德语 (MG) 的语法分析数据,进行从现代德语到中古高地德语 (MHG) 的跨语言转移,训练了一个在 MHG 测试集上取得了 67.3% 的 F1 分数的词法成分分析器,相较于最佳零 - shot 跨 - 用 Transformer 近似实现 CKY
本文研究了 transformer 模型近似 CKY 算法的能力,并通过直接预测分析结果,避免了 CKY 算法对句子长度的三次依赖。研究发现,在标准的短语句法分析基准测试中,这种方法在速度上比 CKY 还要快,但仍然能够实现与 CKY 相媲 - 听觉中大脑的句法结构处理
本文从语法分析的角度出发,通过探索不同的句法分析方法和语法特征对大脑语言网络的影响,以及与语义信息的关系,研究了其对大脑活动的预测能力,发现不同的语法分析方法在大脑不同区域的编码效果不同,而语法信息和语义信息的结合能够更好地预测大脑活动。
- 无监督语法归纳是否需要像素?
本论文探究了多模态线索对于语法成分归纳是否仍然存在显著收益,发现相对于以往多模态方法,基于大型语言模型的 C-PCFG(LC-PCFG)方法在无监督的成分归纳任务中表现更好,并且在参数计算上可以降低 50% 以上,在图像辅助模型的训练时间上 - 透过标注实现解析
该研究探讨了如何将基于上下文的分析方法转化为标注流程,并通过实验证明:推导树的线性转化和其与输入序列的对齐是实现精确标注标记的最重要因素。
- 中文分词与基于跨度的短语结构分析联合
提出了一种方法,通过将额外标签添加到语法分析树中的每个中文字符,来联合进行中文分词和基于跨度的语法成分分析,实验证明该算法在 CTB5.1 上优于最近的联合分词和语法成分分析模型。
- 有序神经组成分析
提出了一种新颖的算法,使用神经跨度编码器与语法树结构进行句法分析,利用 GPU 并行计算实现了对传统跨度组合评分进行更精密算法的计算,并在 Penn Treebank 数据集上取得了较好的预测性能。
- CPTAM: 句法分析树聚合方法
本文提出了一种基于真相发现想法的分句结构树聚合方法,分别从结构聚合和成分标签聚合两步着手,结果表明该方法相较于现有聚合基线方法有较好的聚合表现,并且得到的权重能充分评估常见的句法结构分析方法。
- ACL使用指针网络实现自底向上的短语句法分析和嵌套命名实体识别
本文提出了一种新的指向机制,将嵌套的命名实体识别转换为成分分析,从而实现用线性步骤并保持结构一致性地解决两个相似任务的目的,并在多个基准测试数据集上取得了表现良好的成果。
- EMNLP通过跨度约束,在远程监督下改进潜在树归纳
本研究提出了一种使用远程监督形式的跨度约束技术来提高无监督语法分析性能的方法。通过少量跨度约束,可以大大提高无监督分析系统 DIORA 的性能。我们的实验表明,基于实体的跨度约束可以使英语 WSJ Penn Treebank 的组成分析提高 - ACL神经组合成分解析
该研究提出了两个快速神经组合模型,用于句法分析,分别是二元模型和多分支模型,它们的理论复杂度是次二次的,实际复杂度较低,其中二元模型在 Penn Treebank 上取得了 92.54 的 F1 分数,并以 1327.2 个句子 / 秒的速 - ACL从自然出现的括号结构中学习句法
使用人类的句法直觉构建了一种部分括号感知的结构化斜坡损失,通过训练和应用于自然出现的括号数据,实验表明相较于其他无监督系统,我们的模型更准确地诱导了句法结构。在英语 WSJ 语料库上,我们的模型对于成分分析获得了无标签 F1 得分 68.9 - AAAI基于部分观察 TreeCRFs 的嵌套命名实体识别
本研究提出了基于部分可观测的树条件随机场(Partially-Observed-TreeCRFs)的嵌套命名实体识别方法,使用类似于组成句子解析的方法,将标注实体认定为具有观测值的树节点,而其他实体为潜在节点,并采用掩码算法来实现节点的不同 - EMNLP利用跨度注意力机制改进组成结构分析
本文提出了一种利用跨度注意力和分类跨度注意力的神经图表句法分析方法,通过加入 n-gram 信息,得以更好的建模上下文信息,并在阿拉伯语、中文和英语解析中都取得了最先进的性能。
- EMNLP使用有序神经元实现潜在树学习:其生成哪些句法结构?
研究表明,使用 ON-LSTM 等模型进行自然语言处理,可以在没有人为注释的情况下学习组成句法分析,相对最佳状态的性能表现较好,但在解析内部结构更复杂的名词短语时存在困难,并可能高估在动词之前分割点的高度。我们推测采用不同于单向语言建模的训 - IJCAI快速准确的神经 CRF 短语结构句法分析
本研究旨在提出一种快速准确的神经 CRF 成分句法分析器,采用内部算法批处理、边界表示和双仿射关注等手段,提高了句法分析的效率和性能,并在三个数据集上达到了最新的最高性能。
- ACL指向式高效组成句法分析
我们提出了一种新的成分分析模型,将分析问题转化为一系列指向任务,支持高效的自上而下编码和学习目标。实验表明,我们的方法在不使用预训练模型的情况下取得 92.78 F1 的结果,使用预训练 BERT,达到了 95.48 F1 和最先进的技术水