MMSep, 2023

一种安全且加速的基于深度强化学习的 O-RAN 切片的混合迁移学习方法

TL;DR提出了使用深度强化学习 (DRL) 算法的开放无线接入网络 (O-RAN) 切片的转移学习 (TL) 辅助方法,通过政策复用和蒸馏转移学习方法实现了快速收敛和改进泛化能力,显著提高了初始奖励值和收敛场景百分比,减少了奖励方差。