深度语义解析中的更深入洞察：具有挑战性的基准测试

Apr, 2024

深度语义解析中的更深入洞察：具有挑战性的基准测试

Gaining More Insight into Neural Semantic Parsing with Challenging Benchmarks

Xiao Zhang, Chunliu Wang, Rik van Noord, Johan Bos

TL;DR通过提出更系统的数据划分方法，引入两个具有挑战性的测试集，我们评估了五种神经模型在语义解析和生成上的性能，结果表明当面对这些挑战时，模型性能下降（有时甚至显著），揭示了神经模型在面对这些挑战时的限制。

Abstract

The parallel meaning bank (PMB) serves as a corpus for semantic processing with a focus on semantic parsing and text generation. Currently

parallel meaning bank semantic processing neural parsers data splits semantic parsing

发现论文，激发创造

跨图银行的组合语义解析

本研究提出了一种基于神经网络的语义解析器，它能够对不同的图数据库实现更高的准确性，并通过结合 BERT 嵌入和多任务学习技术进一步提高其准确度，从而在 DM、PAS、PSD、AMR 2015 和 EDS 等多个任务上取得了最新的最优结果。

Jun, 2019

平行语义库：向一个带有组合意义表示注释的多语语料库的翻译迈进

Parallel Meaning Bank 是一个包含四种语言 (英语、德语、意大利语和荷兰语) 的 11 百万单词的翻译语料库，词汇对齐的翻译文本上的语义注释基于跨语言映射，采用统计模型进行。语义注释由五个主要步骤组成，包括：句子和词汇项的分割；组合范畴语法的句法分析；通用语义标签；符号化；基于话语表征理论的组成语义分析。这些步骤都是使用半监督训练的统计模型执行的。使用的注释模型都是语言无关的。我们的初步结果很有前途。

Feb, 2017

BenchCLAMP：语义解析语言模型评估基准

引入 BenchCLAMP，这是一种用于评估受限语言模型解析的基准测试，可通过提示或经过微调的语言模型的受限解码生成基于输入文本分析的语义输出。在 BenchCLAMP 中，为六个语义解析数据集提供了上下文无关文法，支持低、中、高三种资源分割，并提供了易于使用的工具包，以便语言模型开发人员进行语义分析评估。

Jun, 2022

多知识库神经语义解析

通过在不同领域的语言中利用结构规律，并在多个知识库中共享信息来训练语义解析器的序列到序列模型，同时在解码时提供域的编码，可以显著提高解析准确性，从而实现了针对 Overnight 数据集（包含八个领域）的最新性能，将模型参数的数量降低了 7 倍。

Feb, 2017

一个语义分析器解析所有问题：基于序列到序列多任务学习的语义解析数据集

本文为研究使用多任务学习 (MTL) 框架统一不同的含义数据集和训练单一模型，使用了五个数据集 (Geoquery，NLMaps，TOP，Overnight，AMR) 进行实验，我们发现在不增加总参数数量的情况下，全网络共享的 MTL 架构的解析精度与单任务的基线相当或更好，同时也提供了更好的组合推广性，我们还提出了一种可与广泛使用的比例抽样策略相比较的竞争性选择任务抽样方法。

Jun, 2021

评估印度语跨语言语义分析

为了解决印度语言语义分析数据集缺乏的问题，提出了适用于 11 种印度语言的 Inter-bilingual Seq2seq 语义分析数据集 IE-SEMPARSE，并在不同的训练测试策略下评估了现有的多语言 seq2seq 模型。

Apr, 2023

重新审视颈部疼痛：语言模型的语义短语处理基准

介绍了 LexBench，这是一套全面评估套件，用于测试语言模型在十个语义短语处理任务上的性能。通过实验，验证了模型尺寸与任务性能之间的关系，进一步研究了少样本学习在语义关系分类方面的差距，并且发现强模型在语义短语处理上的性能与人类水平相当。

May, 2024

基于语义解析的知识库问答

本综述探讨了基于知识库的问题回答（KBQA）的两个独特挑战，并综述了现有 KBQA 方法的解决方法，其中建议通过深度学习领域的语义分析研究成果，解决当前 KBQA 研究遇到的瓶颈，特别是在预训练语言模型的时代。

Sep, 2022

面向稀疏数据的并行分层机器理解模型

本篇论文中，我们基于神经网络提出了一种新的方法 Parallel-Hierarchical model 来应对训练数据量有限的 MCTest 数据集中自然语言理解问题，并在评测中取得了新的 state of the art，表现优于之前的手工特征提取方法和神经网络方法。

Mar, 2016

基于预训练语言模型的多语言基于图表的成分句法分析提取

本研究开发了一种基于图表的方法和有效的 top-K 集成技术，通过应用这种方法到多语言的预训练语言模型中，可以在集成和语言无关的方式下诱导出九种语言的句子的非平凡解析，同时发现了普遍的注意力头，这些头与句法信息的感知是一致的，验证了该方法的鲁棒性。

Apr, 2020