LLM 作为 DBA
D-Bot 是基于大型语言模型的数据库诊断系统,能够从诊断文档中自动获取知识,并在可接受的时间范围内生成合理和有根据的诊断报告,包括确定根本原因和解决方案。通过在真实基准测试中验证,D-Bot 可以有效地分析未见异常的根本原因,明显优于传统方法和 GPT-4 等基准模型。
Dec, 2023
LLMDB 是一种通过应用机器学习和大型语言模型优化数据管理问题的范例,具有高泛化能力和推理能力,可避免幻觉问题,并通过引入特定领域的知识、矢量数据库和 LLM 代理来提高准确性,其中三个真实场景包括查询重写、数据库诊断和数据分析。
Feb, 2024
本研究介绍了一个新的长格式数据库问答数据集,旨在评估大型语言模型(LLMs)与 SQL 解释器的互动。研究发现即使对于最先进的 GPT-4 模型,这个任务也存在巨大挑战。我们提出并评估了两种互动策略,并对互动过程中的各个阶段进行了细致分析。一个重要发现是确定了两个主要瓶颈,即规划能力和生成多个 SQL 查询能力。为了解决准确评估答案质量的挑战,我们引入了一个多代理评估框架,模拟学术同行评审过程,增强了我们评估的精确性和可靠性。该框架使我们能够更加细致地了解当前 LLMs 在复杂检索和推理任务中的优点和局限性。
Nov, 2023
利用知识生成 SQL 的框架对于 text-to-SQL 任务中缺乏知识的查询可以提供准确的 SQL 生成操作,并通过强化学习和数据库反馈进一步提高模型性能。
Feb, 2024
根据自然语言问题(文本到 SQL)生成准确的 SQL 是一个长期存在的问题,传统的文本到 SQL 系统使用人工工程和深度神经网络,而最近的大型语言模型(LLMs)已经展示出在自然语言理解方面的显著能力,因此,将 LLM-based 实现整合到文本到 SQL 研究中可以带来独特的机遇、挑战和解决方案。
Jun, 2024
评估了大型语言模型(LLMs)在解释和执行自然语言查询与传统 SQL 时,在资源利用和准确性方面的表现,结果显示使用 LLMs 进行数据库查询会导致显著的能源开销,不建议用 LLMs 替代关系数据库。
Apr, 2024
通过构建医学助手和医生之间的合作,我们建立了一个医学数据集 DoctorFLAN,用于支持医生的全部工作流程,并通过构建医生定向场景的评估来验证该数据集的有效性。
Jun, 2024
通过引入层级分布式的大型语言模型(LLM)架构,提高 LLM 在异构计算平台上的可访问性和可部署性,实现按需访问和定制化服务,并在用户与应用需求之间取得最佳权衡,推动人工智能技术的进步。
Jan, 2024