NIPSFeb, 2018
利用深度强化学习及自我对弈的方式优化存在不完美信息的复杂真实移动网络的仿真和实际模拟
Sim-to-Real Optimization of Complex Real World Mobile Network with Imperfect Information via Deep Reinforcement Learning from Self-play
Yongxi Tan, Jin Yang, Xin Chen, Qitao Song, Yunjun Chen...
TL;DR该研究提出了一个基于深度强化学习和图卷积神经网络的跨界面学习框架,该框架在移动网络领域进行了 6 个场地试验,成功的将学习从模拟器中转移到了具有复杂实时限制和有限信息的实际应用场景中。