自然语言到 Kusto 查询的 NL2KQL
基于知识库的问答(KBQA)旨在根据知识库来回答事实性问题。本研究针对无人系统中的知识图推理问答的 CCKS2023 竞赛,在 ChatGPT 和 GPT-3 等大型语言模型在许多问答任务中取得的最近成功的启发下,提出了基于 ChatGPT 的 Cypher 查询语言(CQL)生成框架,从给定的自然语言问题中生成最适合的 CQL 查询。我们的生成框架包括六个部分:根据给定的自然语言问题预测 CQL 的语法相关信息的辅助模型,从给定的自然语言问题中提取专有名词的专有名词匹配器,检索输入样例的相似示例的演示示例选择器,设计 ChatGPT 的输入模板的提示构造器,生成 CQL 的 ChatGPT 模型,以及从多样化的输出中获取最终答案的集成模型。凭借我们的基于 ChatGPT 的 CQL 生成框架,我们在 CCKS 2023 无人系统知识图推理问答竞赛中获得第二名,F1-score 为 0.92676。
Nov, 2023
使用数据增强技术和基于采样的内容感知 BERT 模型 (ColloQL) 实现了鲁棒的自然语言搜索 (NLS) 查询的文本到 SQL 建模,评估表明该方法优于现有技术。
Oct, 2020
该研究提出了一种使用可微分运算符访问软符号数据库的框架,可以方便地调整软知识库中与事实相关的置信度,将先前的知识以手工编码的知识库访问规则的形式整合进来,或者学习使用从文本中提取的信息实例化查询模板。此框架可在单个 GPU 上处理数百万行和数十万个实体的知识库。
May, 2019
使用低代码平台中的自然语言(NL)和 SQL 查询数据,我们提出了一个流程,让开发人员能够以自然语言检索数据,并使用 NL 模型生成 SQL。通过与生产数据的反馈,我们验证了流程的有效性,并观察到采用该流程后在四个不同模型中的特性采用率提高了 240%,参与率提高了 220%,失败率降低了 90%。
Aug, 2023
自然语言处理技术 (NLP) 在信息系统中的交互方式发生了革命性的变化,强调了将自然语言查询转化为 SQL 等形式查询语言,然而对于语料库查询语言 (CQL) 这一在文本语料中进行语言研究和详细分析的关键工具却未受到足够重视,手动构建 CQL 查询是一项复杂、耗时的任务,需要大量专业知识,这对研究人员和从业者都构成了重要挑战。本文提出了第一个文本到 CQL 任务,旨在自动将自然语言转化为 CQL。我们提出了一个全面的框架,包括一个特别策划的大规模数据集和利用大型语言模型 (LLMs) 进行有效的文本到 CQL 任务的方法。此外,我们建立了先进的评估指标来评估生成的查询的句法和语义准确性。我们提供了创新的 LLM 转换方法和详细的实验,并通过实验结果证明了我们方法的有效性,并提供了关于文本到 CQL 任务的复杂性的深入见解。
Feb, 2024
利用 Query Plan Language (QPL) 和 Large Language Models (LLMs),本文探讨了通过简化语法和模块化规范复杂查询来创建一个更易于学习和验证的查询语言,以便使非程序员能够更好地评估交互式查询计划助手生成的查询计划,进而提高复杂查询的准确性。
Dec, 2023
通过与知识库进行直接交互生成逻辑形式,我们引入了 Interactive-KBQA 框架来解决知识库问答领域的问题,该框架包括三种通用 API 用于知识库交互,通过步骤推理过程注释数据集,展示了我们模型的适应性和潜力,并在低资源场景中以极少的示例达到了优秀的结果。
Feb, 2024
引入 SUQL,结构化和非结构化查询语言,它是第一个在形式上可执行表示中自然覆盖结构化和非结构化数据查询的表达。通过增加几个自由文本原语来形成精确、简洁和表达力强的表示。使用大型语言模型基于 SUQL 开发的交互式搜索代理程序,包括适用于 SUQL 的少样本上下文语义解析器。在验证我们的方法时,引入了一个由众包问题和有关真实餐厅的对话组成的数据集。数据集中超过 51% 的问题需要使用结构化和非结构化数据,表明这是一种常见现象。我们表明,基于 SUQL 的少样本交互式代理程序在 89.3% 的情况下可以找到满足所有用户需求的实体,而一个强大且常用的基准系统只能在 65.0% 的情况下实现相同效果。
Nov, 2023
FlexKBQA 是一种利用大型语言模型解决少样本知识库问答任务的方法,通过自动化算法从知识库中生成多样的程序,利用语言模型将其转化为自然语言问题。该方法还引入了执行引导自训练的策略来缓解合成数据和真实用户问题之间的分布差异,并利用大型语言模型的推理能力来增强整个框架。在 GrailQA、WebQSP 和 KQA Pro 上的实验证明,FlexKBQA 在少样本甚至零样本情景下,只需少量注释即可达到令人印象深刻的结果,超过了所有之前的基准,并且接近于监督模型的性能,相对于完全监督模型性能达到 93%。我们认为 FlexKBQA 在大型和轻量级模型的更好集成方面代表了重要进展。
Aug, 2023