Mar, 2021

Open-RAN 网络资源分配的自博弈学习策略

TL;DR本文提出了基于深度强化学习和类似于 AlphaGo Zero 的神经蒙特卡罗树搜索的自我对抗自学习策略,以实现不同网络条件下的智能 RU-DU 资源分配,并研究了 ORAN 系统中 RU-DU 资源分配问题的 2D 装箱模型