Oct, 2022

DIMES:可微元求解器用于组合优化问题

TL;DR本文提出DIMES算法,通过采样来优化候选解的分布,使用连续空间来代替离散解空间,用稳定的REINFORCE方法进行训练和微调,同时利用元学习框架对模型参数进行有效的初始化来解决 DRL在大规模组合优化中的可扩展性挑战,实验证明DIMES 在旅行商问题和最大独立集问题的大型基准数据集上优于最近的DRL方法。