- 神经组合优化算法用于解决车辆路径问题:综述与展望
基于对相关出版物和预印本的全面审查,我们将所有神经组合优化求解器分为四个不同的类别,并提出了克服当前最先进求解器不足之处的有希望和可行的方向,并对来自强化、监督和无监督学习范例的代表性神经组合优化求解器在小规模和大规模车辆路径问题上的性能进 - 通用车辆路径规划的提示学习
本文探讨了神经组合优化中高效的提示学习方法,以便将预训练模型快速适应解决来自不同分布的路径问题实例。实验表明,该方法不仅在分布内预测上表现良好,还能零样本泛化到多样的新任务,胜过现有的广义模型。
- 基于哈密顿量的量子强化学习用于神经计算组合优化
基于 Hamiltonian 的量子强化学习(QRL)是将量子计算与神经组合优化相结合的一种方法,通过对组合优化问题的 Hamiltonian 公式建模,拥有较好的训练性能,适用于广泛的问题类别,并与 QAOA 进行了比较。
- 基于实例的适应性算法用于大规模神经组合优化问题通用化
大规模神经组合优化模型的实例条件适应模型 (ICAM) 和基于强化学习的训练方案可在不同规模下解决旅行商问题 (TSP) 并实现最佳性能。
- 自我改进学习的可扩展神经组合优化
提出了一种自我改进学习(Self-Improved Learning, SIL)方法,用于提高神经组合优化(neural combinatorial optimization, NCO)的可扩展性,包括有效的模型训练和解决大规模问题实例的线 - 神经组合优化的自我改进:无替换抽样,仅改善
通过结合行为克隆和增强学习方法,本文简化了端到端的神经组合优化训练过程,采用随机抽样解决方案并利用概率策略改进来提高模型性能,在旅行推销员问题和车辆路径问题方面取得了令人满意的结果,并应用于作业车间调度问题,超越现有的方法。
- 用于路由问题的多任务学习及问题间的零样本泛化
该论文通过属性组合的方式,建立了一个统一模型,成功解决了车辆路径问题的不同组合情况,大幅提高了解决方案的效率并在物流应用中取得了显著的性能提升。
- 神经组合优化与重度译码器:迈向大规模泛化
我们提出了一种新颖的具有强大泛化能力的轻量级编码器和重型解码器模型(LEHD model),它可以解决大规模的组合优化问题,包括旅行推销员问题(TSP)和车辆路径问题(CVRP),并且能够推广到实际世界的相关问题。
- 路由竞技场:一个神经路由求解器的基准测试套件
神经组合优化是一项近年来研究热点,然而现有评估方法存在缺陷,对于旧有的运筹学方法也存在忽视。为改进这些问题,本研究提出了一个路由问题基准套件 ——Routing Arena。该评估方法考虑不同应用的解决方案质量和任意性能,并引入了新的评估度 - 一个模型,适用于任何 CSP: 图神经网络作为快速全局搜索启发式算法用于约束满足
提出了一种通用的图神经网络架构,该架构可以作为任何约束满足问题的端到端搜索启发式进行训练。该方法基于一种新颖的 CSP 图形表示,可以以纯数据驱动的方式为任何 CSP 生成问题特定的启发式,对于从随机数据中学习启发式,该方法在已知的 CSP - KDD神经组合优化算法的泛化
本文采用元学习技术来在多种任务中训练一个模型,以优化适应新任务的能力,从而提高两个最先进的模型的泛化能力,实验表明该方法在两个 CO 问题上都有显著改善。
- 神经组合优化:领域的新玩家
本文对神经网络在传统组合优化框架中的性能、可迁移性、计算成本和对更大样本的普适性进行了详细研究,并在 NP-hard 问题线性排序问题上开发了神经组合优化模型。
- ICLR神经多目标组合优化问题中的 Pareto 集学习
本文通过神经组合优化的思想,提出了多目标组合优化问题的学习方法,模型可直接生成逼近帕累托前沿的解,证明了该方法在多目标问题上的有效性。
- 神经组合优化中课程学习策略的评估
本论文研究利用一种基于心理学的课程学习方法来提高神经网络在组合优化问题中的性能,以达到与传统的确定性求解器相当甚至更好的精度和效率。
- POMO: 强化学习中带有多个最优解的策略优化
使用改进的 REINFORCE 算法的 POMO 方法,结合了基于增强的推理方法,可获得用于解决 NP-hard 问题的先进的启发式方法,可用于广泛的组合优化问题,显着提高了其性能和速度。
- 使用强化学习的受限组合优化
本文提出一个深度强化学习的框架来解决受限的组合优化问题,将受约束的组合问题定义为完全可观的受约束马尔可夫决策过程(CMDP),并提出从不满足的约束产生惩罚信号,以推断作为启发式算法的策略。通过对约束工厂和资源分配问题进行的实验表明,本文的提