Oct, 2023

数字孪生辅助深度强化学习用于网络切片入场控制的在线优化

TL;DR5G 及更高网络中多样化网络服务的扩散引发了网络切片技术的出现。其中,接纳控制通过选择性接受服务请求,在实现特定优化目标方面起关键作用。本文提出一种数字孪生(DT)辅助的深度强化学习(DRL)解决方案,以解决 DRL 模型初始不稳定性阻碍其在真实网络中实际部署的问题。通过监督学习建立 DT,并在 DRL 模型的训练阶段利用其辅助。广泛的模拟实验表明,与直接训练的最新状态 Dueling-DQN 相比,DT 辅助的 DRL 模型在初期训练时提高了 40%以上的资源利用率,并且相比于直接训练的 DRL 模型提高了 20%以上。在保持模型优化长期奖励能力的同时实现了这一改进。