RAPID: 动态公共云环境中快速在线策略学习的实现

Apr, 2023

RAPID: 动态公共云环境中快速在线策略学习的实现

RAPID: Enabling Fast Online Policy Learning in Dynamic Public Cloud Environments

Drew Penney, Bin Li, Lizhong Chen, Jaroslaw J. Sydir, Anna Drewek-Ossowicka...

TL;DR提出了一种 RAPID 框架，它能够在高度动态的操作环境中实现快速的、完全在线的资源分配策略学习，从而有效地共享资源，提高服务利用率和降低所有权成本。RAPID 利用轻量级的 QoS 预测，通过启用领域知识启发技术来实现样本效率和偏差降低，以比先前的工作快几个数量级的速率来指导策略学习，从而实现学习稳定的资源分配策略，提高 QoS 9 倍，并提高了 19-43% 的最佳努力工作性能。

Abstract

resource sharing between multiple workloads has become a prominent practice among cloud service providers, motivated by demand for improved resource utilization and reduced cost of ownership. Effective

resource sharing cloud service qos requirements online learning resource allocation

发现论文，激发创造

成本感知连续学习中的快速上下文适应

本文探讨了在 5G 等新型网络中，如何平衡学习过程和用户数据平面的资源需求，并提出了一种动态策略来达成资源的有效利用和数据保障。研究结果表明，该方法在减少对用户 QoS 干扰的同时，可以比传统静态分配方法更快地达到高效的资源分配策略，达到了一个近似理想离线联邦学习解决方案的性能。

Jun, 2023

边缘云多用户推理编排的在线学习

我们提出了一种基于强化学习的计算卸载解决方案，它可以在考虑首选深度学习模型选择技术的情况下学习最佳卸载策略，以最小化响应时间同时提供足够的准确性，我们的解决方案在 AWS 和 ARM 核心配置的多个实现中提供 35％的加速，并且最少仅有 0.9％的准确性降低，展示了我们在线学习框架在边缘计算及联云系统中编配深度学习推理的潜力。

Feb, 2022

学习的成本：基于学习的 RRM 的效率与功效对比（适用于 6G）

本文介绍了动态平衡策略，旨在在云端和边缘节点之间进行数据交换并学习最有效的资源管理策略，以最大程度地减少学习过程的开销，同时尽可能地提高用户的服务质量。

Nov, 2022

云计算中优化资源供应的成本感知机制

通过学习为基础的资源配置方法，实现了云计算中的低成本、高效能需求的资源调配方案。通过综合评估，我们的方法有效地满足了大多数需求，并且受到了性能目标的支持。

Sep, 2023

基于深度强化学习的云资源分配和功耗管理的层级框架

研究提出一种基于深度强化学习的层次化框架，用于云计算系统中的资源分配和电源管理问题，采用自动编码器和权重共享结构，以解决高维状态空间问题，采用 LSTM 建模工作负载预测，并采用分布式方式操作的无模型 RL 电源管理器处理本地部分问题。

Mar, 2017

基于深度强化学习的云原生无线网络资源分配

基于容器虚拟化的云原生无线网络架构，应用深度强化学习算法来监控网络状态和动态分配资源，优化了网络分片和多接入边缘计算等场景的资源分配，大幅提高了网络效率。

May, 2023

使用强化学习实现公平稳定的 DNN 多租户多加速器系统实时调度

这篇论文解决了云服务中管理服务质量（QoS）的关键挑战，着重研究了个别租户期望和不同服务水平指标（SLI）的细微差别。它引入了一种新的方法，利用深度强化学习在多租户、多加速器的云环境中进行租户特定的 QoS 管理。所选择的 SLI，即截止时间满足率，允许客户为每个服务请求量身定制服务质量。提出了一种新颖的在线调度算法，针对多加速器系统中的深度神经网络，着重保证租户层面和模型特定的 QoS 水平，并考虑实时约束。

Feb, 2024

云计算中可延迟工作负载的在线调度的先进强化学习框架

云计算平台中的高效资源利用与完美用户体验通常相互冲突。本文提出了一种名为 “云中可延迟作业在线调度” 的在线可延迟工作调度方法，采用深度强化学习模型学习调度策略，并利用多个辅助任务提供更好的状态表示和改进模型性能，从而在在线环境中合理安排部署计划，实现用户等待时间短、平台资源利用率高的目标。所提出的方法在公共数据集上进行了验证并展示了卓越的性能。

Jun, 2024

公平稳定的在线分配的主动学习

我们探索了一种用于动态公平资源分配问题的主动学习方法，该方法假设在在线资源分配过程的每个时期，仅从选择的代理人子集中获取反馈。尽管存在这种限制，我们提出的算法在包括资源分配问题中常用的公平度量和匹配机制中的稳定性考虑等各种度量中，提供了与时间周期数次线性相关的后悔界限。我们算法的关键洞察在于通过利用对决性的上限和下限置信区间来自适应地识别最具信息量的反馈。通过这种策略，我们证明高效的决策不需要大量的反馈，并为各种问题类别产生高效的结果。

Jun, 2024

云边端 IoT 网络中基于联邦强化学习的动态调度任务的协作策略学习

本研究提出了一种动态调度任务的新型协作策略学习框架，该框架使用联邦强化学习并使用云边终端 IoT 网络的层次结构聚合不同边缘的本地策略并取得了很好的效果。

Jul, 2023