Jun, 2022

基于深度强化学习的列生成算法框架

TL;DR本文提出了RLCG——一种用于解决大规模整数线性规划的迭代算法,它是第一个采用强化学习方法的列生成算法,并使用图神经网络表示感兴趣的LP的变量约束结构,成功应用于切割库存问题和带时间窗口的车辆路由问题中,相对于常用的贪心策略,该算法平均缩短22.4%CSP和40.9%VRPTW的CG迭代次数。