Aug, 2023

基于强化学习的无自回归旅行商问题求解器

TL;DRNAR4TSP 是第一个成功结合强化学习和非循环解码的解决 TSP 问题的算法,通过使用一个特殊设计的图神经网络以非循环的方式生成 TSP 解决方案,实现更快的推理速度,其训练使用了增强型强化学习策略,消除了传统基于监督学习的非循环模型的昂贵标签依赖,实验结果表明 NAR4TSP 在解决质量、推理延迟和泛化能力方面优于四个最先进的模型,此外,我们展示了 NAR4TSP 解码过程和整体路径规划的可行性和有效性的可视化。