基于深度学习的自然语言文本到 SQL 查询转换:一项调查
该文回顾了 Text-to-SQL 在数据集、方法和评估方面的最新进展,总结了该领域所面临的挑战,并讨论了未来的研究方向,对于现有工作的快速访问和激励未来研究具有重要的指导意义。
Aug, 2022
该研究综述了文本到结构化查询语言解析的深度学习方法,介绍了单轮和多轮对话的文本到 SQL 解析语料库,阐明了预训练语言模型和现有方法,探讨了面临的挑战和未来发展方向。
Aug, 2022
根据自然语言问题(文本到 SQL)生成准确的 SQL 是一个长期存在的问题,传统的文本到 SQL 系统使用人工工程和深度神经网络,而最近的大型语言模型(LLMs)已经展示出在自然语言理解方面的显著能力,因此,将 LLM-based 实现整合到文本到 SQL 研究中可以带来独特的机遇、挑战和解决方案。
Jun, 2024
基于一个实际的部署案例和真实用户提问数据,本研究评估了 Text-to-SQL 系统在不同数据模型下的健壮性,并探讨了语言模型的性能以及训练数据规模、预处理和后处理步骤对系统性能的影响。此外,研究还为研究社区提供了一个新的基准数据集,可评估针对不同数据模型的查询复杂度。
Feb, 2024
本研究考虑将自然语言转换成 SQL,用于关系数据库的数据检索。我们提出了一种新的编码 - 解码框架,包括新的语义特征和语法感知状态等新方法。实证评估结果表明,我们的方法在真实世界的数据库和查询上明显优于现有技术。
Nov, 2017
本文提出了一种新方法 TypeSQL,通过将问题转换为插槽填充任务,并利用类型信息来更好地理解自然语言问题中的稀有实体和数字,从而实现了通过自然语言与关系型数据库进行交互。在 WikiSQL 数据集上测试该方法,比现有技术提高了 5.5%的性能。同时,利用数据库内容进行访问可以显著提高用户查询的性能,TypeSQL 的准确度为 82.6%,相对于之前的内容敏感模型提高了 17.5%。
Apr, 2018
自然语言处理引起了用户与表格数据交互方式的革命,通过更直观、基于语言的界面,从传统的查询语言和手动绘图转变。大语言模型(LLMs)如 ChatGPT 及其后续模型进一步推进了这一领域,为自然语言处理技术开辟了新的途径。本研究综述了面向表格数据查询与可视化的自然语言界面,该界面允许用户使用自然语言查询与数据进行交互。我们介绍了这些界面背后的基本概念和技术,特别关注实现自然语言到 SQL 查询或数据可视化命令的语义解析技术。接着,我们从数据集、方法论、评估指标和系统设计等角度探讨了文本到 SQL 和文本到可视化问题的最新进展。这包括深入研究了 LLMs 的影响,突出了它们的优势、限制和未来改进的潜力。通过本综述,我们旨在为对开发和应用大语言模型时代的数据交互自然语言界面感兴趣的研究人员和实践者提供一条路线图。
Oct, 2023
通过大型语言模型驱动的我们的文本到 SQL 生成管道的设计和实现解决了数据分析师高复杂度 SQL 查询的支持、低延迟的即席查询需求,以及对领域特定术语和实践的理解的挑战。
Jun, 2024
基于物联网文本到 SQL 数据集,我们研究了如何从返回的数据中推断新信息,通过两阶段处理(查询和数据信息推断)可以改善文本到 SQL 的性能,并提供了测试领域特定推理的新方法。
Jun, 2024