MMNov, 2012

TACT: 一种基于转移学习 Actor-Critic 的移动通信无线接入网络节能框架

TL;DR本文研究了如何通过基站开关操作来降低无线电接入网络的能量消耗。为此,我们根据马尔科夫决策过程对流量变化进行建模,并设计了一个基于强化学习的开关操作方案,其中利用了历史周期或邻近区域中的传递学习专业知识的转移演员 - 评论家算法。通过在各种实际配置下的广泛模拟评估,我们证明了所提出的算法可以显著提高能源效率,而延迟性能的牺牲是可以接受的。