Jan, 2023

在通用约束编程求解器内训练深度 Q 学习代理

TL;DR本文提出了一种结合深度 Q 学习算法、定制奖励信号和异构图神经网络架构的通用学习过程,用于在约束编程求解器中获取值选择启发式,并在图着色、最大独立集和最大割问题上进行实验,表明该框架能够在通用的前提下,找到更接近最优解的更好解决方案,而无需大量回溯。