Jan, 2024

Sibyl: 预测时间演化的查询工作负载

TL;DR数据库系统通常依赖于历史查询跟踪来进行基于工作负载的性能调优,然而实际生产工作负载是时变的,因此历史查询对于优化未来工作负载无效。为应对这一挑战,我们提出了SIBYL,一个端到端机器学习框架,准确地预测未来查询序列,并能在各种预测窗口中提供完整的查询语句。通过从真实工作负载中获取的见解,我们提出了基于模板的特征化技术,并开发了采用编码-解码结构的堆叠LSTM用于准确预测查询工作负载。我们还开发了改进在大预测窗口下的预测准确性,并能在具有查询到达率高度变化的大工作负载上实现高扩展性的技术。最后,我们提出了处理工作负载漂移的技术。我们对四个真实工作负载进行评估,结果表明SIBYL可以以87.3%中位数F1分数预测工作负载,并在应用于物化视图选择和索引选择应用程序时分别实现了1.7倍和1.3倍的性能改进。