在语义解析器的输出中寻找更好的数据库查询

Oct, 2022

在语义解析器的输出中寻找更好的数据库查询

Searching for Better Database Queries in the Outputs of Semantic Parsers

Anton Osokin, Irina Saparina, Ramil Yarullin

TL;DR研究数据库查询的自然语言生成问题，提出一种基于搜索算法的神经自回归模型改进方法，应用于最先进的语义解析器，以便能够发现可在不同数据集上通过所有测试的查询。

Abstract

The task of generating a database query from a question in natural language suffers from ambiguity and insufficiently precise description of the goal. The problem is amplified when the system needs to generalize

database query natural language generalization neural autoregressive models semantic parsers

发现论文，激发创造

AskYourDB: 使用自然语言查询和可视化关系型数据库的端到端系统

使用自然语言处理和语义解析的方法，在数据库查询过程中引入智能化，以帮助商业用户能够直接查询数据库。同时增加了自动可视化框架使得产品可供商业使用。

Oct, 2022

针对文本到 SQL 解析的数据库结构全局推理

本研究针对语义解析器在零样本学习中难以正确选择新数据库常数集的问题，提出一种全局推理数据库常数集的解析器，采用图神经网络的消息传递机制，考虑问题的情境信息，软选择一部分数据库常数集，并通过训练模型根据数据库常数与问题单词的全局匹配度对解析结果排序。在面向包含复杂数据库的零样本语义解析数据集 Spider 中，我们将该方法应用于当前最先进模型，将准确率从 39.4％提高到 47.4％。

Aug, 2019

从 SQL 查询中生成问题改善了神经语义解析

本文通过在最大手工标注语义解析数据集 WikiSQL 上展示问题生成是一种有效的半监督学习方法，使我们能够用百分之三十的监督训练数据来学习最先进的神经网络语义解析器，并发现语义解析器的准确性和训练数据量之间存在对数关系。

Aug, 2018

通过动态架构编码用自然语言纠正语义解析

提出了一种利用自然语言反馈进行语义解析更正的方法，通过将任务的语义和语法困难分离，只需一轮自然语言反馈即可将文本到 SQL 解析器的准确性提高 26％；同时表明 T5-base 模型能在无需训练的情况下，纠正 T5-large 模型的错误。

May, 2023

基于 AST 排序和架构修剪的改进检索增强型文本到 SQL 模型

通过动态检索输入数据库信息和使用抽象语法树选择少量示例以进行上下文学习，本文提出一种从大型语言模型的角度着眼于文本到 SQL 语义解析的方法，并研究并行语义解析器在生成预期 SQL 查询的近似版本方面的利用程度。作者利用不到 500M 参数的极其高效的逼近模型进行了实验，应用于语义解析的单语和跨语言基准测试中，取得了比现有基准的改进效果，并对未来工作方向提出了有趣的见解。

Jul, 2024

从用户反馈中学习神经语义解析器

本研究提出了一种使用神经序列模型直接将话语映射到 SQL 的自然语言接口构建方法，并基于用户反馈实现高质量的语义解析，实验表明这种方法快速适用于任何新领域。

Apr, 2017

通过增加自然语言变化提升语义解析的泛化能力

使用数据增强来增强文本到 SQL 解析器对自然语言变化的鲁棒性，通过大型语言模型生成更真实和多样化的问题，从而在评估集合中实现显著的改进。

Feb, 2024

语义解析：基于语法和表格的 SQL 生成

利用生成模型将自然语言问题转换成 SQL 查询，并通过考虑表格结构和 SQL 语法来提高查询的可执行性和准确性。在 WikiSQL 数据集上进行实验，将执行准确率从 69.0％提高到 74.4％。

Apr, 2018

AutoQA：利用纯合成训练数据从数据库到问答语义解析器

AutoQA 是一种方法和工具包，用于生成可以回答数据库问题的语义解析器，其可以自动生成训练集，并使用自动改写和基于模板的解析来查找不同词性中属性的替代表达方式，并使用一种新颖的过滤自动改写器来生成完整句子的正确改写。该工具应用于 Schema2QA 数据集和 Overnight 数据集，其回答正确率与使用专家自然语言注释和来自众包工人的改写数据训练的模型相当。

Oct, 2020

使用细粒度查询理解提升文本转 SQL 语义解析

本文提出了一种基于标记级精细化查询理解的通用、模块化的神经语义分析框架，包括命名实体识别器（NER）、神经实体链接器（NEL）和神经语义解析器（NSP），该框架联合建模查询和数据库，并基于动态生成的语法合成基于树结构的 SQL 查询。实验证明，该模型在 SQUALL 数据集上的执行准确率达到了 56.8％，超过了现有技术水平 2.7％。

Sep, 2022