Mar, 2023

强化学习中历史感知的超参数优化框架

TL;DR本文提出了一种复杂事件处理和时间模型相结合的框架来优化强化学习系统的超参数,同时利用历史信息和并行资源来提供反馈和调整超参数。作者在使用 RL(强化学习)的 5G 移动通信案例研究中测试了该方法,结果表明历史感知框架相比传统的超参数调整方法显著提高了性能。