SQL 查询生成的最新进展:综述
本文研究了使用自然语言作为桥梁,通过有效访问数据库创建一个高效的文本到 SQL 模型,重点探讨了 24 个不同神经网络模型以及 11 个常用数据集的特点和局限性,最终讨论了 Text2SQL 技术在实现无缝数据查询方面的可能性。
Aug, 2022
自然语言处理引起了用户与表格数据交互方式的革命,通过更直观、基于语言的界面,从传统的查询语言和手动绘图转变。大语言模型(LLMs)如 ChatGPT 及其后续模型进一步推进了这一领域,为自然语言处理技术开辟了新的途径。本研究综述了面向表格数据查询与可视化的自然语言界面,该界面允许用户使用自然语言查询与数据进行交互。我们介绍了这些界面背后的基本概念和技术,特别关注实现自然语言到 SQL 查询或数据可视化命令的语义解析技术。接着,我们从数据集、方法论、评估指标和系统设计等角度探讨了文本到 SQL 和文本到可视化问题的最新进展。这包括深入研究了 LLMs 的影响,突出了它们的优势、限制和未来改进的潜力。通过本综述,我们旨在为对开发和应用大语言模型时代的数据交互自然语言界面感兴趣的研究人员和实践者提供一条路线图。
Oct, 2023
本文评估了 24 个最近开发的自然语言数据库接口(NLIs),并将其分类为基于关键字、模式、解析和语法的四组,发现语法为基础的系统是最强大的,但高度依赖其手动设计的规则,同时本文的研究成果对于设计能够回答各种用户问题的 NLIs 至关重要。
Jun, 2019
本文介绍了一种基于深度模型的数据探索工具 DBPal,它采用自然语言界面,能够将自然语言问题转化为 SQL 查询,并为用户提供自动完成功能,帮助用户更有效地编写复杂查询。
Apr, 2018
本文介绍了一种通用的可转移自然语言交互系统,通过自动注释机制分离出自然语言查询中的数据库 schema 和数据,采用个性化序列模型将注释的查询翻译成 SQL 语句,实验证明该方法在 WikiSQL 数据集上的表现优于传统方法,并且可被应用于其他数据集而无需重新训练。
Sep, 2018
使用自然语言处理和语义解析的方法,在数据库查询过程中引入智能化,以帮助商业用户能够直接查询数据库。同时增加了自动可视化框架使得产品可供商业使用。
Oct, 2022
根据自然语言问题(文本到 SQL)生成准确的 SQL 是一个长期存在的问题,传统的文本到 SQL 系统使用人工工程和深度神经网络,而最近的大型语言模型(LLMs)已经展示出在自然语言理解方面的显著能力,因此,将 LLM-based 实现整合到文本到 SQL 研究中可以带来独特的机遇、挑战和解决方案。
Jun, 2024
本文旨在设计更有效的语音接口,以便查询关系型数据库中的结构化数据。首先引入了一种名为 Speech-to-SQL 的任务,该任务旨在理解由人类发音传达的信息,并将其直接转化为结构化查询语言(SQL)语句。本文提出了一种称为 SpeechSQLNet 的新型端到端神经体系结构,该体系结构可以直接将人类的语音转化为 SQL 查询,而无需外部自动语音识别步骤。为验证所提出模型的有效性,另构建了一个名为 SpeechQL 的数据集,并展开了广泛的实验证明,证明 SpeechSQLNet 可以直接从人类语音中综合高质量的 SQL 查询,精确匹配准确性方面超越了各种竞争对手以及级联方法。
Jan, 2022
使用低代码平台中的自然语言(NL)和 SQL 查询数据,我们提出了一个流程,让开发人员能够以自然语言检索数据,并使用 NL 模型生成 SQL。通过与生产数据的反馈,我们验证了流程的有效性,并观察到采用该流程后在四个不同模型中的特性采用率提高了 240%,参与率提高了 220%,失败率降低了 90%。
Aug, 2023