利用生成模型进行数据存储系统性能建模
云计算和大数据技术的快速发展使得存储系统成为数据中心的基础构件,尽管设计和实现可靠的存储系统仍然具有挑战性,但通过预测性预测可以加强存储系统的可靠性,我们对机器学习在存储系统中的应用进行了调查,讨论了各种机制和实地研究,评估了每项研究工作的优势和局限性。
Jul, 2023
基于机器学习的性能模型在构建关键的作业调度和应用程序优化决策中越来越被使用。我们开发了持续学习性能模型,考虑到数据分布漂移,减轻灾难性遗忘,并提高泛化能力。我们的最佳模型能够保持准确性,无论系统变化引起的新数据分布,同时相比于朴素方法,在整个数据序列的预测准确度上提升了 2 倍。
Oct, 2023
提出了一种新的元模型概念,称为生成元建模,旨在构建一个 “模拟器的快速模拟器”,能够在保持相同输入的条件下,以更快的速度生成随机输出,方便实时决策的立即计算任何摘要统计量。
Nov, 2023
使用生成建模方法,本文提供了关于生成模型训练的理论洞察力,重点强调数据生成分布与训练数据生成分布之间的误差应随着样本量趋近无穷而趋近于零,并确保训练数据生成分布与任何复制训练数据样本的分布之间足够远。
Jul, 2023
本研究提出了一个基于机器学习的数据生成框架,旨在辅助那些利用模拟来研究各种物理系统或过程的研究人员。我们的方法包括两个步骤:首先,我们使用有限的模拟数据训练监督预测模型来预测模拟结果;然后,我们使用强化学习代理来生成准确的、类似于模拟的数据,从而更有效地探索参数空间并深入了解物理系统或过程。我们通过两个案例研究:一个关注地震破裂物理,另一个关注新材料开发,证明了所提出框架的有效性。
May, 2023
研究提出了一种高效的模型 HigeNet,用于预测长时间序列时间序列,能够有效地监控大量机器数据,具有低计算复杂度,能够与现有数据规模高度匹配,并通过实验展示其比其他五个最先进的模型更具高效性。
Nov, 2022
利用高维混沌系统中的内部混沌动力学作为一种从训练数据集中生成新数据点的方法,在一组基本架构中通过简单的学习规则来实现这一目标,并通过标准准确度度量来表征生成数据点的质量。
May, 2024
本研究提出了一种可以估算算法性能预测模型泛化能力的方法,并通过在基准测试套件之间训练预测模型来测试该方法的可行性,结果表明,特征空间中的泛化模式确实反映在性能空间中。
May, 2023
这篇论文提出了一种通用框架来合成更复杂的数据结构,其中包括复合和嵌套类型,并通过因果变换器构建了一种实际的解决方案,用于结构(类型映射)和列表(类型的重复实例),在标准基准数据集上的结果表明,这种方式的实现在机器学习实用性和统计相似性方面均明显优于当前最先进的模型,并且对于以前无法解决的具有多重嵌套和稀疏数据的两个复杂层次数据集表现出非常强的结果。
Feb, 2022
该研究旨在通过使用机器学习模型来预测 GPU 故障,以改善在深度学习任务中可能导致的严重后果,并提出多种技术来提高预测精度,最终将预测精度从 46.3%提高到 84.0%。
Jan, 2022