Jan, 2022

使用多头注意力深度强化学习解决动态图问题

TL;DR本文提出一种名为 Graph Temporal Attention with Reinforcement Learning (GTA-RL) 的新型框架,针对动态组合优化问题学习启发式解决方案。该框架结构包括一个能够嵌入组合问题实例的时间特征的编码器和一个能够动态聚焦于嵌入特征以找到所需组合问题实例的解码器,并针对实时版本组合优化问题进行了扩展。实验证明,与现有方法相比,该方法在动态和实时图组合优化方面具有更高的效率和优化求解器的有效性。