Jun, 2022

使用Rollouts和MAX-SAT解决带时间窗口的有容量车辆路径问题

TL;DR本文提出一种混合方法,将强化学习、策略推进和可满足性求解器相结合,以实现计算时间和解决方案质量之间的可调节权衡,该方法可以解决任意规模的问题,且无需额外训练,在解决车辆路由问题中的效果优于现有的基于学习的方法和元启发式算法,更具有泛化性。