自然语言到 Kusto 查询的 NL2KQL

Apr, 2024

NL2KQL: From Natural Language to Kusto Query

Amir H. Abdi, Xinye Tang, Jeremias Eichelbaum, Mahan Das, Alex Klein...

TL;DRNL2KQL 是一种创新的框架，使用大型语言模型将自然语言查询转换为 KQL 查询，并包括模式优化、示例选择和查询修正等关键组件，同时还介绍了一种生成合成 NLQ-KQL 对的方法，并通过在线和离线度量验证了该框架的性能。

Abstract

Data is growing rapidly in volume and complexity. Proficiency in database query languages is pivotal for crafting effective queries. As coding assistants become more prevalent, there is significant opportunity to enhance database query languages. The kusto query language (KQL) is a wid

database query languages kusto query language nl2kql large language models dataset generation

发现论文，激发创造

基於大型語言模型的無人系統知識庫問答的上下文學習

基于知识库的问答（KBQA）旨在根据知识库来回答事实性问题。本研究针对无人系统中的知识图推理问答的 CCKS2023 竞赛，在 ChatGPT 和 GPT-3 等大型语言模型在许多问答任务中取得的最近成功的启发下，提出了基于 ChatGPT 的 Cypher 查询语言（CQL）生成框架，从给定的自然语言问题中生成最适合的 CQL 查询。我们的生成框架包括六个部分：根据给定的自然语言问题预测 CQL 的语法相关信息的辅助模型，从给定的自然语言问题中提取专有名词的专有名词匹配器，检索输入样例的相似示例的演示示例选择器，设计 ChatGPT 的输入模板的提示构造器，生成 CQL 的 ChatGPT 模型，以及从多样化的输出中获取最终答案的集成模型。凭借我们的基于 ChatGPT 的 CQL 生成框架，我们在 CCKS 2023 无人系统知识图推理问答竞赛中获得第二名，F1-score 为 0.92676。

Nov, 2023

ColloQL：搜索查询的跨领域文本转 SQL 的鲁棒性解决方案

使用数据增强技术和基于采样的内容感知 BERT 模型 (ColloQL) 实现了鲁棒的自然语言搜索 (NLS) 查询的文本到 SQL 建模，评估表明该方法优于现有技术。

Oct, 2020

神经查询语言：一种 Tensorflow 的知识库查询语言

该研究提出了一种使用可微分运算符访问软符号数据库的框架，可以方便地调整软知识库中与事实相关的置信度，将先前的知识以手工编码的知识库访问规则的形式整合进来，或者学习使用从文本中提取的信息实例化查询模板。此框架可在单个 GPU 上处理数百万行和数十万个实体的知识库。

May, 2019

低代码平台中的自然语言到 SQL

使用低代码平台中的自然语言（NL）和 SQL 查询数据，我们提出了一个流程，让开发人员能够以自然语言检索数据，并使用 NL 模型生成 SQL。通过与生产数据的反馈，我们验证了流程的有效性，并观察到采用该流程后在四个不同模型中的特性采用率提高了 240％，参与率提高了 220％，失败率降低了 90％。

Aug, 2023

从文本到 CQL：自然语言与语料库搜索引擎的桥梁

自然语言处理技术 (NLP) 在信息系统中的交互方式发生了革命性的变化，强调了将自然语言查询转化为 SQL 等形式查询语言，然而对于语料库查询语言 (CQL) 这一在文本语料中进行语言研究和详细分析的关键工具却未受到足够重视，手动构建 CQL 查询是一项复杂、耗时的任务，需要大量专业知识，这对研究人员和从业者都构成了重要挑战。本文提出了第一个文本到 CQL 任务，旨在自动将自然语言转化为 CQL。我们提出了一个全面的框架，包括一个特别策划的大规模数据集和利用大型语言模型 (LLMs) 进行有效的文本到 CQL 任务的方法。此外，我们建立了先进的评估指标来评估生成的查询的句法和语义准确性。我们提供了创新的 LLM 转换方法和详细的实验，并通过实验结果证明了我们方法的有效性，并提供了关于文本到 CQL 任务的复杂性的深入见解。

Feb, 2024

针对复杂数据检索的语义解析：面向查询计划和无代码访问关系数据库的 SQL

利用 Query Plan Language (QPL) 和 Large Language Models (LLMs)，本文探讨了通过简化语法和模块化规范复杂查询来创建一个更易于学习和验证的查询语言，以便使非程序员能够更好地评估交互式查询计划助手生成的查询计划，进而提高复杂查询的准确性。

Dec, 2023

基于数据库的对话自然语言接口的高效部署

研究使用对话式多轮数据的方法加速训练自然语言到查询语言的机器学习模型，旨在解决领域数据有限及集成过程繁琐耗时等问题。

May, 2020

交互式 KBQA：大型语言模型的知识库问答多轮交互

通过与知识库进行直接交互生成逻辑形式，我们引入了 Interactive-KBQA 框架来解决知识库问答领域的问题，该框架包括三种通用 API 用于知识库交互，通过步骤推理过程注释数据集，展示了我们模型的适应性和潜力，并在低资源场景中以极少的示例达到了优秀的结果。

Feb, 2024

SUQL：基于大型语言模型的结构化和非结构化数据的对话式搜索

引入 SUQL，结构化和非结构化查询语言，它是第一个在形式上可执行表示中自然覆盖结构化和非结构化数据查询的表达。通过增加几个自由文本原语来形成精确、简洁和表达力强的表示。使用大型语言模型基于 SUQL 开发的交互式搜索代理程序，包括适用于 SUQL 的少样本上下文语义解析器。在验证我们的方法时，引入了一个由众包问题和有关真实餐厅的对话组成的数据集。数据集中超过 51% 的问题需要使用结构化和非结构化数据，表明这是一种常见现象。我们表明，基于 SUQL 的少样本交互式代理程序在 89.3% 的情况下可以找到满足所有用户需求的实体，而一个强大且常用的基准系统只能在 65.0% 的情况下实现相同效果。

Nov, 2023

FlexKBQA: 一个灵活的 LLM 驱动框架用于少样本知识库问答

FlexKBQA 是一种利用大型语言模型解决少样本知识库问答任务的方法，通过自动化算法从知识库中生成多样的程序，利用语言模型将其转化为自然语言问题。该方法还引入了执行引导自训练的策略来缓解合成数据和真实用户问题之间的分布差异，并利用大型语言模型的推理能力来增强整个框架。在 GrailQA、WebQSP 和 KQA Pro 上的实验证明，FlexKBQA 在少样本甚至零样本情景下，只需少量注释即可达到令人印象深刻的结果，超过了所有之前的基准，并且接近于监督模型的性能，相对于完全监督模型性能达到 93%。我们认为 FlexKBQA 在大型和轻量级模型的更好集成方面代表了重要进展。

Aug, 2023