DBCopilot: 拓展自然语言查询至海量数据库
使用数据增强技术和基于采样的内容感知 BERT 模型 (ColloQL) 实现了鲁棒的自然语言搜索 (NLS) 查询的文本到 SQL 建模,评估表明该方法优于现有技术。
Oct, 2020
本文介绍了一种基于深度模型的数据探索工具 DBPal,它采用自然语言界面,能够将自然语言问题转化为 SQL 查询,并为用户提供自动完成功能,帮助用户更有效地编写复杂查询。
Apr, 2018
本文研究了使用自然语言作为桥梁,通过有效访问数据库创建一个高效的文本到 SQL 模型,重点探讨了 24 个不同神经网络模型以及 11 个常用数据集的特点和局限性,最终讨论了 Text2SQL 技术在实现无缝数据查询方面的可能性。
Aug, 2022
根据自然语言问题(文本到 SQL)生成准确的 SQL 是一个长期存在的问题,传统的文本到 SQL 系统使用人工工程和深度神经网络,而最近的大型语言模型(LLMs)已经展示出在自然语言理解方面的显著能力,因此,将 LLM-based 实现整合到文本到 SQL 研究中可以带来独特的机遇、挑战和解决方案。
Jun, 2024
使用低代码平台中的自然语言(NL)和 SQL 查询数据,我们提出了一个流程,让开发人员能够以自然语言检索数据,并使用 NL 模型生成 SQL。通过与生产数据的反馈,我们验证了流程的有效性,并观察到采用该流程后在四个不同模型中的特性采用率提高了 240%,参与率提高了 220%,失败率降低了 90%。
Aug, 2023
提出了基于大型语言模型的数据处理系统 Data-Copilot,通过自主设计各种功能接口,实现了数据的自动处理和可视化,符合人机交互的需求。
Jun, 2023
xdbtagger 是一种可解释的混合翻译管道,适用于自然语言查询翻译为结构化查询语言的问题,通过文本和视觉方式解释决策,有效地提高了翻译的准确性和效率,适用于多个实际关系数据库和数据集。
Oct, 2022
我们提出了一种更适应性更强的提示方法,通过查询重写和 SQL 增强来提高 Text-to-SQL 模型的性能,并在商业数据集上实验证明了显著的性能改善。
Oct, 2023
基于一个实际的部署案例和真实用户提问数据,本研究评估了 Text-to-SQL 系统在不同数据模型下的健壮性,并探讨了语言模型的性能以及训练数据规模、预处理和后处理步骤对系统性能的影响。此外,研究还为研究社区提供了一个新的基准数据集,可评估针对不同数据模型的查询复杂度。
Feb, 2024