Apr, 2023

RAPID: 动态公共云环境中快速在线策略学习的实现

TL;DR提出了一种 RAPID 框架,它能够在高度动态的操作环境中实现快速的、完全在线的资源分配策略学习,从而有效地共享资源,提高服务利用率和降低所有权成本。RAPID 利用轻量级的 QoS 预测,通过启用领域知识启发技术来实现样本效率和偏差降低,以比先前的工作快几个数量级的速率来指导策略学习,从而实现学习稳定的资源分配策略,提高 QoS 9 倍,并提高了 19-43% 的最佳努力工作性能。