MMOct, 2022

强化学习在定向控制器合成中的扩展应用

TL;DR本研究提出使用强化学习基于状态特征学习启发式启发式方法且优化了 Deep Q-Network,以用于解决离散事件系统中的无阻塞属性,实现在小规模问题上的学习推广到更大规模问题实例,结果表明其效果更好。