Oct, 2021

学习协作策略以解决 NP-hard 路径规划问题

TL;DR本论文提出了一种新的层次化问题求解策略,称为学习协作策略,它使用两个迭代的深度强化学习策略:播种机和修订机,旨在有效地找到近似最优解,扩展了深度强化学习框架在解决 NP-hard 路由问题方面的应用。