BriefGPT.xyz
Jun, 2019
强化学习驱动的启发式优化
Reinforcement Learning Driven Heuristic Optimization
HTML
PDF
Qingpeng Cai, Will Hang, Azalia Mirhoseini, George Tucker, Jingtao Wang...
TL;DR
本文介绍了一种使用强化学习初值方法框架来改善启发式算法的初始解决方案的方法,并在 NP 完全的装箱问题上的实验中展示了 RLHO 方法比我们的基线表现更好。
Abstract
heuristic algorithms
such as
simulated annealing
, Concorde, and METIS are effective and widely used approaches to find solutions to
combinatorial
→