Jul, 2022

离线排名策略学习在高效混合整数规划中的分支排序

TL;DR本文提出了一种离线强化学习方法,将分支定界问题的分支决策作为全局决策问题来解决,并通过排名奖励方案将分支方法的长期优势与短期视野进行区分,建立一个离线 MIP 数据集。作者称该方法比现有的基于启发式方法和现有的深度学习方法在优化算法性能方面更有效。