TreeDQN:学习最小化分枝定界树
本文提出一种基于强化学习的方法用于解决组合优化中的数据标记和推理延迟问题,并使用蒙特卡罗树搜索和价值网络提高策略网络的性能表现。作者在四种不同类别的组合优化问题上进行了评估,结果表明该方法相较于现有机器学习和启发式方法有更优的性能表现。
Jun, 2022
本文提出了基于深度强化学习的分支定界算法,该算法利用离线模仿学习与自主生成数据相结合的优化方法,并且引入了一种优先存储机制来控制二者之间的混合比例,以此提高算法的性能表现。文章在三个公共研究基准上对所提出的算法进行了评估,并与三种经典的启发式方法以及一种先进的模仿学习算法进行了比较。研究结果表明,所提出的算法在性能上表现最佳,并具有不断提高分支定界算法性能的潜力。
Jan, 2022
文章提出了一种名为 FMSTS 的新型增强学习方法,采用一种全新的分支策略来优化整数线性规划问题,具有一致性和泛化能力,并在计算实验中验证了其有效性。
May, 2020
本文通过强化学习的方法,提出了树马尔科夫决策过程的概念,从头学习分支规则,并通过计算实验证明了树马尔科夫决策过程对于 MILP 中学习分支问题具有更好的收敛性能。
May, 2022
本文提出一种名为 retro branching 的强化学习方法,用于解决混合整数线性规划问题中的 branch-and-bound 算法中的变量选择问题,与之前的方法相比,本方法不需要专家指导或预训练,且在四种组合问题上表现优异。
May, 2022
本文提出了一种聚合图神经网络和指针机制的图指针网络模型来学习分支定界中的变量选择策略,结果表明该模型在求解速度和搜索树大小方面都优于现有的机器学习和专家设计的分支规则。
Jul, 2023
本文提出了一种离线强化学习方法,将分支定界问题的分支决策作为全局决策问题来解决,并通过排名奖励方案将分支方法的长期优势与短期视野进行区分,建立一个离线 MIP 数据集。作者称该方法比现有的基于启发式方法和现有的深度学习方法在优化算法性能方面更有效。
Jul, 2022
使用一种新颖的双模拟技术,通过强化学习模型从整个树状态中选择节点,借助图神经网络生成基于路径的概率分布,将节点选择建模为概率分布,训练模型以实现高质量的节点选择策略,并在严格时间约束下,在多个基准测试中显示出显著的性能改进。
Sep, 2023
本文提出了一种基于图卷积神经网络的分支定界变量选择新模型,通过模仿学习和强分支专家规则训练,成功解决了组合优化问题。实验结果表明,该方法不仅在分支机制上优于现有的机器学习方法,而且在大问题上也优于现有的专家设计分支规则。
Jun, 2019