递归迭代问题中的分支学习方法预测与优化
从观测特征中通过预测模型直接学习最优解的方法被提出,该方法是泛化的,基于学习优化范式,能够提供高效、准确和灵活的解决方案给一系列具有挑战性的预测优化问题。
Nov, 2023
我们提供了一个新的更简单更强大的框架称为 Two-Stage Predict+Optimize,可用于预测和优化的设置中,通过训练算法涵盖了所有混合整数线性程序,并且实验证明我们的训练框架在所有传统和最先进方法上具有卓越的预测性能。
Nov, 2023
本文提出了一个新的 Predict+Optimize 框架,可以处理既有在优化目标又有在约束条件中的未知参数,引入了校正函数和惩罚项来解决相关问题,同时提出了一种可处理所有 packing 和 covering 线性方程的算法,实验证明该方法比传统方法表现优秀。
Sep, 2022
我们提出了一个集成的预测 - 优化(PredOpt)框架,通过预测二进制决策变量在最优解中的值,高效地解决顺序决策问题。我们通过循环神经网络和滑动注意机制捕捉组合优化问题的顺序特性,并将基于注意力的编码器 - 解码器神经网络架构与消除不可行性和泛化框架相结合,以学习高质量的适用于时间相关优化问题的可行解。我们的结果表明,可以成功地使用在较短和较小维度实例上训练的模型来预测更长更大维度的问题。优化解决时间可缩短三个数量级,平均最优性差距小于 0.1%。我们将 PredOpt 与各种专门设计的启发式方法进行比较,并证明我们的框架表现优于它们。PredOpt 对于需要立即且重复求解的动态 MIP 问题具有优势。
Nov, 2023
本文提出了一种聚合图神经网络和指针机制的图指针网络模型来学习分支定界中的变量选择策略,结果表明该模型在求解速度和搜索树大小方面都优于现有的机器学习和专家设计的分支规则。
Jul, 2023
本文介绍了一种基于强化学习的组合优化问题解决方法,使用树马尔可夫决策过程视角选择变量分支,并且优化学习对象,相较之前的强化学习方法,训练数据量更小,生成树的大小更小。
Jun, 2023
利用 Smart Predict and Optimize (SPO) 方法解决离散优化问题,通过弛化问题和启发式初始化学习和解决,证明了该方法在复杂调度和加权背包等大规模组合优化问题中的优势。
Nov, 2019
本文提出一种基于强化学习的方法用于解决组合优化中的数据标记和推理延迟问题,并使用蒙特卡罗树搜索和价值网络提高策略网络的性能表现。作者在四种不同类别的组合优化问题上进行了评估,结果表明该方法相较于现有机器学习和启发式方法有更优的性能表现。
Jun, 2022
该论文提出了一种利用机器学习和约束优化相结合的方法来解决包含在求解时未知参数的优化问题。通过引入损失函数后验后悔来处理包含约束的未知数值,该方法首次提出可以精确计算后验后悔以解决原来只能使用估计算法的问题,并在大量实验中成功优化了针对线性规划问题的试验方案。
Mar, 2023
该研究探讨了在 “先预测,再优化” 框架下使用决策树进行决策问题的决策,并提出了一种可观的方法称为 SPO Trees (SPOTs) 用于训练决策树,该方法具有较高的解释性。实验结果表明,SPOTs 可提供更高质量的决策,并显著降低了模型复杂性。
Feb, 2020