Kepler: 快速参数查询优化的稳健学习

Jun, 2023

Kepler: 快速参数查询优化的稳健学习

Kepler: Robust Learning for Faster Parametric Query Optimization

Lyric Doshi, Vincent Zhuang, Gaurav Jain, Ryan Marcus, Haoyu Huang...

TL;DRKepler是一种基于端到端学习的参数化查询优化方法，采用行数演化算法和神经网络不确定性模型，以实际执行数据评估候选方案并预测最快速的查询计划, 从而显著提高PostgreSQL上多个数据集的查询运行时间。

Abstract

Most existing parametric query optimization (PQO) techniques rely on traditional query optimizer cost models, which are often inaccurate and result in suboptimal query performance. We propose kepler, an

发现论文，激发创造

通过应用于可进化性的统计查询学习的全面表征

本篇论文探讨了统计查询 SQ 学习模型的特点及其学习方法中的查询复杂度，并提出了一种新的基于 boosting 技术的 SQ 学习方法，该方法在维持学习的精确性的前提下有效提高了学习效率，同时证明了在 Valiant 的可进化模型中存在一大类单调进化学习算法。

Feb, 2010

我们准备好了吗？——学习基数估计

本研究旨在探讨学习模型在实际部署中替代基于传统方法的概数估计器的潜力。通过对四个实际数据集进行五种学习方法和八种传统方法的比较，结果显示学习模型更加准确但训练和推理成本较高。此外，我们探究了学习模型在动态环境下的表现和可能出现的问题，并提出了控制成本和提高可信度这两个有前途的研究方向以及其他研究机会。

Dec, 2020

Lero: 一种学习排序查询优化器

本文介绍了 Lero，一种基于传统查询优化器的学习排序查询优化器，该优化器利用数据库的先验知识和机器学习技术，通过比较执行计划的相对优劣来实现查询优化，显著提高了性能，并可用于现有的数据库管理系统中。

Feb, 2023

混合工作负载环境中学习型查询优化的加速

本文提出了一种新的使用数据库统计信息和元数据来调整学习查询优化器以提高性能的集成学习模型BitE，并对现有传统方法进行了比较评估。

Jun, 2023

JoinGym: 一种高效的强化学习查询优化环境

在这篇论文中，我们介绍了一种高效轻量级的强化学习查询优化环境 JoinGym，该环境可用于测试强化学习算法在关于查询的组合优化问题中的泛化能力，并且我们提供了在实际数据管理问题上测试方法的离线跟踪，同时提供了从IMDB数据集生成的3300个SQL查询的所有可能的连接跟踪。

Jul, 2023

FOSS: 查询优化器的自学医生

本研究介绍了一种基于深度强化学习的查询优化框架 FOSS，通过在传统优化器生成的原始计划基础上逐步优化子节点，采用模拟环境进行学习和改进，通过实验证明 FOSS 在延迟性能和优化时间方面优于现有方法，相比 PostgreSQL，在不同基准测试中实现了15％到83％的延迟节约。

Dec, 2023

Roq: 基于风险感知学习成本模型的稳健查询优化

在本篇论文中，我们提出了基于风险感知学习方法的全面框架Robust Optimization of Queries（Roq），它通过一种新颖的鲁棒性概念的形式化和定量测量，实现了鲁棒查询优化。Roq还包括查询计划评估和选择的新策略、算法以及预测查询执行成本和相关风险的新型学习成本模型。我们通过实验证明，与现有技术相比，Roq显著提高了鲁棒查询优化的效果。

Jan, 2024

预算感知查询调优：一种AutoML视角

通过将代价单元视为变量，本文挑战了传统的代价模型观点，并提出了查询优化和工作负载调优的解决方案，实验证明了该方法的有效性。

Mar, 2024

基于图神经网络的查询计划表示的一种新技术

比较研究了使用不同的树模型对优化器在复杂工作负载下的成本估算和计划选择性能的影响，并探索了使用图神经网络在查询计划表示任务中的可能性。提出了一种新颖的树模型，结合有向图神经网络和门控循环单元（GRU），实验结果表明，与现有树模型相比，新的树模型在成本估算任务和计划选择性能方面具有显著改进。

May, 2024

CardBench：用于关系数据库学习基数估计的基准

本文针对关系数据库中基数估计的关键问题，提出了一个系统的基准，涵盖了20000个查询及20个真实数据库，以评估和发展新的学习基数估计方法。研究发现，虽然在简单单表查询中零-shot基数估计表现良好，但在加入连接时准确性下降。然而，通过微调预训练模型，可以显著减少训练开销，从而有效应用于基数估计。

Aug, 2024