Kepler: 快速参数查询优化的稳健学习
本篇论文探讨了统计查询 SQ 学习模型的特点及其学习方法中的查询复杂度,并提出了一种新的基于 boosting 技术的 SQ 学习方法,该方法在维持学习的精确性的前提下有效提高了学习效率,同时证明了在 Valiant 的可进化模型中存在一大类单调进化学习算法。
Feb, 2010
本研究旨在探讨学习模型在实际部署中替代基于传统方法的概数估计器的潜力。通过对四个实际数据集进行五种学习方法和八种传统方法的比较,结果显示学习模型更加准确但训练和推理成本较高。此外,我们探究了学习模型在动态环境下的表现和可能出现的问题,并提出了控制成本和提高可信度这两个有前途的研究方向以及其他研究机会。
Dec, 2020
本文介绍了 Lero,一种基于传统查询优化器的学习排序查询优化器,该优化器利用数据库的先验知识和机器学习技术,通过比较执行计划的相对优劣来实现查询优化,显著提高了性能,并可用于现有的数据库管理系统中。
Feb, 2023
在这篇论文中,我们介绍了一种高效轻量级的强化学习查询优化环境 JoinGym,该环境可用于测试强化学习算法在关于查询的组合优化问题中的泛化能力,并且我们提供了在实际数据管理问题上测试方法的离线跟踪,同时提供了从IMDB数据集生成的3300个SQL查询的所有可能的连接跟踪。
Jul, 2023
本研究介绍了一种基于深度强化学习的查询优化框架 FOSS,通过在传统优化器生成的原始计划基础上逐步优化子节点,采用模拟环境进行学习和改进,通过实验证明 FOSS 在延迟性能和优化时间方面优于现有方法,相比 PostgreSQL,在不同基准测试中实现了15%到83%的延迟节约。
Dec, 2023
在本篇论文中,我们提出了基于风险感知学习方法的全面框架Robust Optimization of Queries(Roq),它通过一种新颖的鲁棒性概念的形式化和定量测量,实现了鲁棒查询优化。Roq还包括查询计划评估和选择的新策略、算法以及预测查询执行成本和相关风险的新型学习成本模型。我们通过实验证明,与现有技术相比,Roq显著提高了鲁棒查询优化的效果。
Jan, 2024
比较研究了使用不同的树模型对优化器在复杂工作负载下的成本估算和计划选择性能的影响,并探索了使用图神经网络在查询计划表示任务中的可能性。提出了一种新颖的树模型,结合有向图神经网络和门控循环单元(GRU),实验结果表明,与现有树模型相比,新的树模型在成本估算任务和计划选择性能方面具有显著改进。
May, 2024
本文针对关系数据库中基数估计的关键问题,提出了一个系统的基准,涵盖了20000个查询及20个真实数据库,以评估和发展新的学习基数估计方法。研究发现,虽然在简单单表查询中零-shot基数估计表现良好,但在加入连接时准确性下降。然而,通过微调预训练模型,可以显著减少训练开销,从而有效应用于基数估计。
Aug, 2024