Nov, 2019
图形指针网络和层次强化学习的组合优化
Combinatorial Optimization by Graph Pointer Networks and Hierarchical
Reinforcement Learning
TL;DR本研究提出使用强化学习训练的图指针网络(Graph Pointer Networks,GPNs)来解决旅行商问题。我们使用GPNs对输入图进行嵌入并通过学习分层策略来优化城市排列。实验结果表明,GPNs对小规模的TSP50/100问题的泛化性能不错,且在TSP500/1000问题中获得了更短的旅行路径和更快的计算时间,同时当问题涉及时间窗口约束时,支持最优解的分层强化学习训练优于以往的基准方法。