组合优化问题的高效主动搜索
本文研究基于深度学习和强化学习的旅行商问题的新模型和架构,强调机器学习在解决组合优化问题方面的限制,并提出了一种新的度量标准ROD以回答两个基本问题。
Sep, 2019
本文介绍了一种基于深度强化学习和约束编程的混合算法,应用于复杂的组合优化问题,并在实验中成功运用于旅行商问题和投资组合优化问题,表现优于单独的深度强化学习和约束编程算法,同时也达到了与工业级求解器相竞争的水平。
Jun, 2020
深度神经网络和强化学习方法在解决复杂的组合问题方面取得了显著的实证成果,本文引入了一种新的理论框架来分析这些方法的有效性,回答了存在生成模型能够生成近似最优解、拥有易处理的参数数量以及优化结果无次优静态点等问题,并介绍了一种新的正则化过程,实验证明其有助于解决梯度消失和避免不良静态点的问题。
Oct, 2023
通过结合行为克隆和增强学习方法,本文简化了端到端的神经组合优化训练过程,采用随机抽样解决方案并利用概率策略改进来提高模型性能,在旅行推销员问题和车辆路径问题方面取得了令人满意的结果,并应用于作业车间调度问题,超越现有的方法。
Mar, 2024
提出了一种自我改进学习(Self-Improved Learning, SIL)方法,用于提高神经组合优化(neural combinatorial optimization, NCO)的可扩展性,包括有效的模型训练和解决大规模问题实例的线性复杂度注意机制。在旅行推销员问题(Travelling Salesman Problem, TSP)和容量车辆路径问题(Capacitated Vehicle Routing Problem, CVRP)上进行的全面实验证明了该方法的出色可扩展性。
Mar, 2024
大规模神经组合优化模型的实例条件适应模型(ICAM)和基于强化学习的训练方案可在不同规模下解决旅行商问题(TSP)并实现最佳性能。
May, 2024
使用成员预测器解决未知线性约束的组合优化问题,以学习和利用替代线性约束的新框架,并通过采样策略和解决0-1整数线性规划来选择需要标记的新点,以提高结果的质量。
May, 2024