ICMLFeb, 2020

增强强化学习的量子启发式组合优化算法

TL;DR本文提出了一种基于量子启发式算法 + 强化学习的方法,在解决 Ising 能量最小化问题方面,该方法通过调整其中一个参数以改进最近看到的解,并使用一种新的 Rescaled Rank Reward (R3) 方法来提高稳定的自我博弈训练效果。训练后可在任何问题实例中采样高质量的解,并优于基线启发式和黑盒超参数优化方法。