- AMBROSIA: 将模棱两可的问题解析为数据库查询的基准测试
我们引入了一个名为 AMBROSIA 的新基准,旨在帮助发展能够识别和解释含有歧义请求的文本至 SQL 解析器。我们的数据集包含展示三种不同类型(范围、附属、模糊)歧义及其解释和相应 SQL 查询的问题。通过从头开始生成数据库的控制生成方法 - ACL使用 LLMs 进行上下文话语解析的少样本适应性
该研究评估基于大型语言模型的语义解析器处理上下文话语的能力,并考察了四种在对话式语义解析中适应上下文话语的范式的比较,研究表明 Rewrite-then-Parse 范式在综合考虑解析准确性、标注成本和错误类型时具有最大潜力。
- 从解析 - 执行到解析 - 执行 - 精炼:改进知识库复杂问题回答的语义解析器
本研究提出了一种名为 parse-execute-refine 的模型,它能够通过对推理过程进行逐步演示的方式,提高 KoPL 语义解析器的推理能力,该模型在三个方面的增强:解析阶段,执行阶段和细化阶段,在进行复杂知识库问答的任务中,比当前 - 文本到 SQL 解析中合成高质量数据的重要性
本文提出了一种新颖的数据合成框架,其中包括来自模式的关键关系、强类型和基于模式距离的列抽样,并采用了 SQL-to-text 任务的中间表示(IR),进一步提高了生成的自然语言问题的质量。实验证明,当现有强大的语义解析器在高质量的合成数据上 - AAAIDFEE: 交互式数据流执行和评估工具包
DFEE 是一个交互式数据流执行和评估工具包,支持语义解析器的执行、可视化和基准测试,提供友好的接口来诊断解析结果,还提出了一个更复杂的基准测试用例和任务成功评估指标来演示如何进行基准测试。
- 在语义解析器的输出中寻找更好的数据库查询
研究数据库查询的自然语言生成问题,提出一种基于搜索算法的神经自回归模型改进方法,应用于最先进的语义解析器,以便能够发现可在不同数据集上通过所有测试的查询。
- 一个语义分析器解析所有问题:基于序列到序列多任务学习的语义解析数据集
本文为研究使用多任务学习 (MTL) 框架统一不同的含义数据集和训练单一模型,使用了五个数据集 (Geoquery,NLMaps,TOP,Overnight,AMR) 进行实验,我们发现在不增加总参数数量的情况下,全网络共享的 MTL 架构 - ACL语义解析中的领域泛化元学习
本文尝试使用基于元学习的框架,旨在实现语义解析的零 - shot 泛化能力,实验结果表明,这种方法对 Spider 数据集上的解析表现有显著的提升。
- EMNLPAutoQA:利用纯合成训练数据从数据库到问答语义解析器
AutoQA 是一种方法和工具包,用于生成可以回答数据库问题的语义解析器,其可以自动生成训练集,并使用自动改写和基于模板的解析来查找不同词性中属性的替代表达方式,并使用一种新颖的过滤自动改写器来生成完整句子的正确改写。该工具应用于 Sche - EMNLP一种通过用户交互学习语义解析器的模仿游戏
本文介绍了一种通过用户直接学习语义解析器的 “人在循环” 方法,在此过程中,语义解析器应该自我观察其不确定性并在不确定时提示用户演示。为了解决演示稀疏性问题,提出了一种新颖的注释高效的仿真学习算法,该算法通过混合演示的状态和自信的预测来迭代 - ACL从不相关数据中学习联合语义解析器
通过从多个数据集中学习语义解析器的新方法,我们将未观测到的正式语义注释视为潜在结构变量,并在现有基础上建模,从而在框架语义解析和语义依赖解析方面取得了改进。
- ACL以 Web 为知识库回答复杂问题
本文提出一种新的框架,用于回答复杂问题,即将复杂问题分解成一系列简单问题,并从这些答案中计算出最终答案。实证结果表明,问题分解将在新数据集上将性能从 20.8 提高到 27.5。
- ACL使用抽象示例的弱监督语义解析
本论文提出了一种训练语义解析器的新方式,即利用抽象化表示,而非强监督方式(程序),以缓解训练过程中的困难。经实验证明,这种方法可以成功地用于处理视觉推理数据集以提升性能。
- ACL从指称中推断逻辑形式
本文提出了一种方法,使用动态规划来表示一组一致的逻辑形式,在生成虚构世界并进行众包标注的基础上,对这些一致的逻辑形式进行过滤,从而提高了基于句子语义分析的问题回答覆盖率。