自然语言到 SQL 查询的类型和内容驱动合成
本文提出了一种新方法 TypeSQL,通过将问题转换为插槽填充任务,并利用类型信息来更好地理解自然语言问题中的稀有实体和数字,从而实现了通过自然语言与关系型数据库进行交互。在 WikiSQL 数据集上测试该方法,比现有技术提高了 5.5%的性能。同时,利用数据库内容进行访问可以显著提高用户查询的性能,TypeSQL 的准确度为 82.6%,相对于之前的内容敏感模型提高了 17.5%。
Apr, 2018
本文旨在设计更有效的语音接口,以便查询关系型数据库中的结构化数据。首先引入了一种名为 Speech-to-SQL 的任务,该任务旨在理解由人类发音传达的信息,并将其直接转化为结构化查询语言(SQL)语句。本文提出了一种称为 SpeechSQLNet 的新型端到端神经体系结构,该体系结构可以直接将人类的语音转化为 SQL 查询,而无需外部自动语音识别步骤。为验证所提出模型的有效性,另构建了一个名为 SpeechQL 的数据集,并展开了广泛的实验证明,证明 SpeechSQLNet 可以直接从人类语音中综合高质量的 SQL 查询,精确匹配准确性方面超越了各种竞争对手以及级联方法。
Jan, 2022
利用生成模型将自然语言问题转换成 SQL 查询,并通过考虑表格结构和 SQL 语法来提高查询的可执行性和准确性。在 WikiSQL 数据集上进行实验,将执行准确率从 69.0%提高到 74.4%。
Apr, 2018
本文提出了一种新颖的数据合成框架,其中包括来自模式的关键关系、强类型和基于模式距离的列抽样,并采用了 SQL-to-text 任务的中间表示(IR),进一步提高了生成的自然语言问题的质量。实验证明,当现有强大的语义解析器在高质量的合成数据上进行预调整时,这些模型在流行的基准测试中的准确性得到了显着提高。
Dec, 2022
本文介绍了一种新的交互机制,允许用户直接编辑一步一步的 SQL 解释,以纠正 SQL 错误,实验结果显示,我们的方法在执行准确性方面比三种 SOTA 方法至少高出 31.6%,用户研究进一步显示,我们的方法可以帮助用户在更短的时间内解决更多的 SQL 任务并提高信心水平,特别是为非专业人士扩展了数据库的使用。
May, 2023
本文提出了一种新的方法,即 SQLNet,通过避免不必要的序列结构来基本解决序列化时的顺序问题,并结合依赖图、序列-集合模型和列注意力机制,可以在 WikiSQL 任务中比之前的方法提高 9% 到 13% 的效果。
Nov, 2017
使用自然语言处理和语义解析的方法,在数据库查询过程中引入智能化,以帮助商业用户能够直接查询数据库。同时增加了自动可视化框架使得产品可供商业使用。
Oct, 2022
该论文探究了自然语言生成 SQL 查询的问题,并使用综合方法设计了三个深度神经网络,应用双向注意机制和卷积神经网络的字符级嵌入来提高结果,最终在 WikiSQL 数据集上达到了最先进的结果。
Dec, 2017
利用大型语言模型(LLMs)将自然语言问题转化为 SQL 查询(文本到 SQL)是一种有前途但具有挑战性的方法,特别是在应用于具有复杂和庞大模式的现实世界数据库时。我们提出了一个新的流程来解决这个问题,该流程有效地检索相关数据和上下文,选择一个高效的模式,并合成正确高效的 SQL 查询。
May, 2024