Open-RAN 网络资源分配的自博弈学习策略

Mar, 2021

Open-RAN 网络资源分配的自博弈学习策略

Self-play Learning Strategies for Resource Assignment in Open-RAN Networks

Xiaoyang Wang, Jonathan D Thomas, Robert J Piechocki, Shipra Kapoor, Raul Santos-Rodriguez...

TL;DR本文提出了基于深度强化学习和类似于 AlphaGo Zero 的神经蒙特卡罗树搜索的自我对抗自学习策略，以实现不同网络条件下的智能 RU-DU 资源分配，并研究了 ORAN 系统中 RU-DU 资源分配问题的 2D 装箱模型

Abstract

open radio access network (oran) is being developed with an aim to democratise access and lower the cost of future mobile data networks, supporting network services with various QoS requirements, such as massive

open radio access network oran resource assignment deep reinforcement learning mobile edge computing

发现论文，激发创造

O-RAN 中的智能负载均衡与资源分配：一种多智能体多臂赌博机方法

该论文研究了如何利用机器学习算法实现开放式无线接入网络的智能化管控，提出了一种基于多智能体和多臂赌博机的负载平衡和资源分配策略，并通过仿真实验证明，该算法在有效提升网络吞吐率的同时，相对于基于规则的和其他启发式算法，更能实现开放接入单元之间的负载均衡。

Mar, 2023

基于 Actor-Critic 学习的 O-RAN 资源分配中的动态 CU-DU 选择

本文提出两种基于 actor-critic 学习的技术来优化资源分配功能的位置以及资源分配决策，并研究了增强学习资源分配在可观测性方面对性能的影响，实验表明，在动态地网络功能（NF）根据服务要求进行重新定位时，使用强化学习技术能够获得延迟和吞吐量的提高。

Oct, 2021

O-RAN 中网络切片的高效资源分配的半监督学习方法

我们提出了一种创新的方法，旨在协调 Open Radio Access Network（O-RAN）中的多个独立 xAPPs，以实现网络切片和资源分配，并优化用户设备（UE）之间的加权吞吐量和物理资源块（PRB）的分配。通过设计 power control xAPP 和 PRB allocation xAPP，我们的方法通过监督学习和无监督学习的组合实现了高效的网络切片问题解决方案。与其他方法相比，我们的方法在不同场景中展现出更高的性能和效果。

Jan, 2024

基于深度强化学习的智能 O-RAN URLLC 流量引导

该研究提出基于机器学习的交通引导方案以预测网络拥塞并在避免其的基础上通过优化设置来服务具备低延迟和高可靠性需求的 URLLC 应用。在 O-RAN 中，比传统反应式交通引导方法平均减少 15.81％的排队延迟。

Mar, 2023

多租户 O-RAN 中，基于拍卖的 x-haul 和云资源分配，保证公平性

本文提出并比较了 min-max fairness 和 Vickrey-Clarke-Groves（VCG）基于拍卖的 x-haul 和 DU-CU 资源分配机制，以创建一个可持续发展的多租户 O-RAN 生态系统，其中使用 PON 虚拟化技术的 x-haul 接口在 RU 和边缘云之间提供光学连接，并设计了有效的启发式算法来提高经济效率和网络资源利用率。

Jan, 2023

基于强化学习的开放式 RAN 中稀疏感知智能大规模随机接入控制

提出了基于强化学习的闭环访问控制方案，通过近实时的无线接入网络智能控制器与环境的持续交互来确定强化学习策略，以实现对 Open Radio Access Network 中大规模访问请求的高效控制和管理，同时还提出了数据驱动的深度强化学习辅助方案，可用于处理连续和高维状态、动作空间的高度复杂的环境。

Mar, 2023

基于深度强化学习的绿色雾计算射频接入网络的模式选择和资源管理

提出基于深度强化学习 (DRL) 的联合模式选择和资源管理方法，使用智能决策优化 C-RAN 和 D2D 模式下的无线和计算资源，旨在通过边缘缓存状态的动态优化长期减少系统能耗。在模拟中，将学习率和边缘缓存服务能力等参数的影响演示出来，并将该方案与其他不同的方案进行对比展示其有效性，并将迁移学习与 DRL 整合以加速学习过程。

Sep, 2018

上行 NOMA-IoT 网络资源分配：一种强化学习方法

本文针对非正交多址技术中的公平资源分配问题，基于强化学习提出了一种高效的资源分配方案，结合深度强化学习算法和 SARSA-learning 算法处理不同网络负载下的差异性问题，并通过数值实验得出在物联网中，非正交多址技术可以比正交多址技术更好地提高系统的吞吐量。

Jul, 2020

O-RAN 动态切片管理的演化深度强化学习

本文介绍了一种新的管理网络切片的框架，该框架使用了基于演化的深度强化学习 (EDRL) 方法，将 O-RAN 切片表示为马尔可夫决策过程 (MDP)，并通过对资源分配的最优解来满足服务需求，模拟结果表明，所提出的方法比 DRL 基线提高了 62.2% 的服务质量。

Aug, 2022

O-RAN 中的智能与学习，用于数据驱动的 NextG 蜂窝网络

本文探讨了 O-RAN 联盟提出的解聚的网络架构是否为 NextG 网络的关键要素，并在此框架下研究了数据驱动优化方法的潜力、挑战和局限性，以及实现自主和自优化网络愿景的深度强化学习智能体通过实时分析与控制的闭环集成的可行性。

Dec, 2020