关键词cardinality estimation
搜索结果 - 10
- PRICE:一种用于跨数据库基数估计的预训练模型
通过使用 PRICE 模型,使用低级别但可传输的数据分布和查询信息特征以及自注意力模型,可以准确计算任何数据库中的基数估计,而准备成本仅为基于基本一维直方图的方法。此外,价格可以在任何具体数据库上进行微调,进一步提高性能。
- 超关联知识图谱的基数估计
本研究旨在通过构建多样化和无偏见的超关系查询集,综合调查超关系知识图上的查询基数估计问题,并提出一种新颖的附加限定词图神经网络(GNN)模型,该模型能够有效地将限定词信息整合,并自适应地合并多个 GNN 层的输出,以准确预测查询基数。实验证 - Duet: 高效且可扩展的混合神经关联理解
我们提出了一种名为 Duet 的新型混合确定建模方法,用于基数估计问题,与之前的方法相比,具有更好的效率和可扩展性。Duet 允许以可微分的形式直接估计范围查询的基数,时间和内存成本大大降低。通过将模型估计错误较大的查询纳入训练过程中,我们 - 使用嵌入和图神经网络对知识图谱进行基数估计
本文提出了一种基于知识图谱嵌入和图神经网络的 GNCE 方法,通过对知识图谱中实体做语义嵌入和使用 GNN 处理查询来准确预测查询的基数,并在多个知识图谱的 q 误差方面对 GNCE 进行评估,表明其在估计准确性方面优于其他方法。
- 我们准备好了吗?—— 学习基数估计
本研究旨在探讨学习模型在实际部署中替代基于传统方法的概数估计器的潜力。通过对四个实际数据集进行五种学习方法和八种传统方法的比较,结果显示学习模型更加准确但训练和推理成本较高。此外,我们探究了学习模型在动态环境下的表现和可能出现的问题,并提出 - NeuroCard: 对所有表格的基数估计
本文介绍了一种名为 NeuroCard 的查询优化器,它利用了神经网络技术,结合了 join 采样和深度自回归模型,能够精确地预测复杂查询的关系及数量。该方法实现了比现有方法更高的精确度,而且具有较小的存储空间和高效的构建时间。
- DeepDB:从数据学习,而非查询!
本文提出以数据驱动的方法来替代常规的以工作负荷为驱动的方式,通过机器学习模型来捕捉行为,并展示数据驱动模型不仅可以提供更好的准确性,而且还能更好的适应未知查询。
- 基于端到端学习的成本估算器
通过提出一种基于树状结构的模型的有效端到端学习成本和基数估计框架,该模型可以同时估计成本和基数,从而解决了传统经验成本和基数估计技术的不足,同时考虑了查询和物理操作的特征提取,提出了一种有效的方法来编码字符串值,并对现有基于学习的方法进行了 - 深度无监督基数估计
使用自动回归模型进行基数估计,提出了一种可处理多维关系表密集统计的新方法。通过蒙特卡罗积分方案,无需独立性假设,即可近似联合数据分布,实现单位误差计算效率,可显著提高准确性和系统运行效率。
- 学习基数:利用深度学习估计相关连接
本文提出了一种基于 MSCN 深度学习模型的基数估计方法,该模型结合了集合语义用于捕获查询特征和真实基数,在解决采样估计的弱点和捕获跨表连接相关性方面表现出色,并在真实数据集上评估证明深度学习技术可以显著提高基数估计的质量。