Aug, 2024

CardBench:用于关系数据库学习基数估计的基准

TL;DR本文针对关系数据库中基数估计的关键问题,提出了一个系统的基准,涵盖了20000个查询及20个真实数据库,以评估和发展新的学习基数估计方法。研究发现,虽然在简单单表查询中零-shot基数估计表现良好,但在加入连接时准确性下降。然而,通过微调预训练模型,可以显著减少训练开销,从而有效应用于基数估计。