基于邻域的 Dubins 旅行推销员问题的特权信息提取

Apr, 2024

基于邻域的 Dubins 旅行推销员问题的特权信息提取

Distilling Privileged Information for Dubins Traveling Salesman Problems with Neighborhoods

Min Kyu Shin, Su-Jeong Park, Seung-Keol Ryu, Heeyeon Kim, Han-Lim Choi

TL;DR文中提出了一种新的学习方法，用于解决带有邻域的 Dubins 旅行推销员问题 (DTSPN)，以快速生成通过给定任务点邻域的非全向车辆的路径。该方法包括两个学习阶段：首先，模型无关的强化学习方法利用特权信息从 LinKernighan 启发式算法生成的专家轨迹中提取知识；随后，监督学习阶段训练一个适应网络，独立解决问题而不依赖特权信息。在第一个学习阶段之前，还设计了一种使用演示数据进行参数初始化的技术，以提高训练效率。所提出的学习方法比 LKH 快约 50 倍，显著优于其他模仿学习和演示式 RL 方法，其中大多数无法感知到所有任务点。

Abstract

This paper presents a novel learning approach for Dubins Traveling Salesman Problems(DTSP) with Neighborhood (dtspn) to quickly produce a tour of a →

learning approach dubins traveling salesman problems dtspn non-holonomic vehicle reinforcement learning

发现论文，激发创造

NeuroLKH: 结合深度学习模型与 Lin-Kernighan-Helsgaun 启发式算法求解旅行商问题

NeuroLKH 采用深度学习和 LKH 启发式算法相结合，通过训练 Sparse Graph Network 模型来解决旅行商问题等路由问题，得出实验结果表明能够优于传统启发式算法并泛化到更大范围问题。

Oct, 2021

学习巡回：运算符设计用于解决方案可行性映射的接送旅行推销员问题

本文旨在开发一种用于一类特殊旅行推销员问题（TSP）的学习方法，即接送 TSP（PDTSP），该方法通过一系列一对一接送节点找到最短路径。我们利用可行解算空间中的操作符来解决 PDTSP，这些操作符将一个可行解映射到另一个可行解，从而限制解决方案搜索范围。通过与经典 OR 算法和现有学习方法进行比较，结果表明我们的方法可以找到比基准更短的路径。

Apr, 2024

将强化学习与 Lin-Kernighan-Helsgaun 算法相结合解决旅行商问题

本文提出了一个基于增强学习的启发式算法 VSR-LKH，它运用 Q-learning、Sarsa、Monte Carlo 三种方法改进了已有的 TSP 算法 Lin-Kernighan-Helsgaun (LKH)，将其高效应用于 111 个 TSP 基准测试，结果表明，该方法表现出具有良好的性能。

Dec, 2020

针对旅行商问题的强化 Lin-Kernighan-Helsgaun 算法

本研究提出了 Variable Strategy Reinforced LKH (VSR-LKH) 与 VSR-LKH-3 算法，分别引入了三种强化学习方法与 LKH 算法相结合，以解决 TSP 问题和 TSP 变体（包括 TSPTW 和 CTSP），经 236 个 TSP 基准测试表明，这些算法具有显著的性能优势。

Jul, 2022

提前预计以避免迟到：解决困难约束旅行推销员问题

使用前瞻信息作为特征，提出一种利用学习方法改善具有时间窗口的 TSP 解决方案合法性的新方法，并构建了具有硬约束条件的 TSPTW 数据集进行准确评估和基准测试。通过对多种数据集进行综合实验，MUSLA 优于现有基线算法且具有一定的泛化能力。

Mar, 2024

面向旅行商问题的图神经网络引导局部搜索

提出了一种基于图神经网络和引导局部搜索的 TSP（旅行商问题）混合数据驱动方法，该方法能够在不损失解决方案质量的同时，快速求解大规模 TSP 实例，经实验证明，我们将 100 个节点问题集的平均最优性差从 1.534% 减少到 0.705%，将 20 个节点实例推广到 100 个节点问题集时，我们将最优性差从 18.845% 减少到 2.622%，提高了 2 倍和 7 倍。

Oct, 2021

旅行商问题的高效图卷积网络技术

本文介绍了一种基于深度学习算法的解决平面欧几里得图中旅行商问题的方法，通过使用图卷积网络构建 TSP 图表示，并通过高度并行化的 Beam Search 非自回归方法输出巡回路径，我们在解决相同节点规模下的问题中比最近提出的自回归深度学习技术表现更好，最终平均优化差距从 50 个节点降低到 0.01％，100 个节点从 2.26％降至 1.39％，尽管相较于标准的运筹学求解器，我们的方法还有所欠缺。

Jun, 2019

学会解决旅行商问题要重新思考泛化

本文提出了一种神经组合优化方法，将学习算法与模型架构相结合，以实现在训练过程中看不到的更大规模的问题的推广。通过对零样本推广的原理研究，控制实验提供了第一手数据，并提供了深度学习的新方向。

Jun, 2020

解决旅行推销员问题的无监督学习

我们提出了 UTSP，这是一个用于解决旅行推销员问题（TSP）的无监督学习框架，使用基于图神经网络（GNN）的代理损失。该方法在参数效率和数据效率方面优于目前的数据驱动 TSP 启发式方法。

Mar, 2023

H-TSP：层次化解决大规模旅行推销员问题

本研究提出了一种基于层次强化学习的端到端学习框架，称为 H-TSP，用于解决大规模 TSP 问题，通过选择子集并使用深度学习模型直接生成解决方案，具有可扩展和高效性。

Apr, 2023