Jun, 2019

强化学习驱动的启发式优化

TL;DR本文介绍了一种使用强化学习初值方法框架来改善启发式算法的初始解决方案的方法,并在 NP 完全的装箱问题上的实验中展示了 RLHO 方法比我们的基线表现更好。