ICMLJun, 2019

强化学习用于整数规划:学习剪切

TL;DR应用深度强化学习技术提升整数规划问题求解算法中割平面方法 (Cutting Plane Method) 的性能表现。通过对算法的智能自适应选择,和其在分支定界算法 (Branch-and-Cut algorithm) 中的应用,表现出在各种不同规模的样例和不同的整数规划问题中,训练出来的深度 RL 代理能显著的超过人类设计的启发式方法。