Mar, 2021
Open-RAN 网络资源分配的自博弈学习策略
Self-play Learning Strategies for Resource Assignment in Open-RAN Networks
Xiaoyang Wang, Jonathan D Thomas, Robert J Piechocki, Shipra Kapoor, Raul Santos-Rodriguez...
TL;DR本文提出了基于深度强化学习和类似于 AlphaGo Zero 的神经蒙特卡罗树搜索的自我对抗自学习策略,以实现不同网络条件下的智能 RU-DU 资源分配,并研究了 ORAN 系统中 RU-DU 资源分配问题的 2D 装箱模型