记忆增强型神经求解器在组合优化中的高效自适应
本文提出了一种利用神经网络和强化学习解决组合优化问题的框架,特别关注旅行推销员问题和背包问题,证明了该方法在不需要太多工程和启发式设计的情况下在二维欧几里得图上取得接近最优结果,并且可以得到具有多达200个项目实例的最优解。
Nov, 2016
本文介绍了一种基于深度强化学习和约束编程的混合算法,应用于复杂的组合优化问题,并在实验中成功运用于旅行商问题和投资组合优化问题,表现优于单独的深度强化学习和约束编程算法,同时也达到了与工业级求解器相竞争的水平。
Jun, 2020
本文提出一种基于强化学习的方法用于解决组合优化中的数据标记和推理延迟问题,并使用蒙特卡罗树搜索和价值网络提高策略网络的性能表现。作者在四种不同类别的组合优化问题上进行了评估,结果表明该方法相较于现有机器学习和启发式方法有更优的性能表现。
Jun, 2022
本研究提出了一种名为 NeuroLS 的本地搜索算法控制器,采用深度图神经网络作为策略模型,通过计算机学习方法,能够优于已知常规搜索控制器和最新的机器学习方法,在求解NP困难度的组合优化问题中,取得了比较理想的结果。
Jun, 2022
通过结合行为克隆和增强学习方法,本文简化了端到端的神经组合优化训练过程,采用随机抽样解决方案并利用概率策略改进来提高模型性能,在旅行推销员问题和车辆路径问题方面取得了令人满意的结果,并应用于作业车间调度问题,超越现有的方法。
Mar, 2024
提出了一种自我改进学习(Self-Improved Learning, SIL)方法,用于提高神经组合优化(neural combinatorial optimization, NCO)的可扩展性,包括有效的模型训练和解决大规模问题实例的线性复杂度注意机制。在旅行推销员问题(Travelling Salesman Problem, TSP)和容量车辆路径问题(Capacitated Vehicle Routing Problem, CVRP)上进行的全面实验证明了该方法的出色可扩展性。
Mar, 2024
大规模神经组合优化模型的实例条件适应模型(ICAM)和基于强化学习的训练方案可在不同规模下解决旅行商问题(TSP)并实现最佳性能。
May, 2024
本研究解决了现有神经组合优化方法在搜索空间探索效率低下的问题,常导致局部最优解困境。通过创新的记忆模块,MARCO框架能够在每个状态下存储并检索相关信息,从而引导搜索过程,促进优化预算的高效利用。实验证明,MARCO在多个组合优化问题中能够发现多样化、更高质量的解决方案,且计算成本低,展现了在神经组合优化领域的潜在影响。
Aug, 2024
本研究解决了当前神经求解器在组合优化问题中利用效率不足的难题。我们提出了一种新的协调神经求解器的通用框架,旨在根据实例将其分配给最适合的求解器。实验结果表明,该框架显著提高了求解性能,并在多个优化问题上实现了显著的改进。
Oct, 2024