Nov, 2023

基于图神经网络的 QUBO 规划激发哈密顿损失函数用于组合优化的强化学习

TL;DR通过引入 QUBO 变换哈密顿量和建立 RL 模型的奖励函数,我们提出了一种改进 PI-GNN 算法的方法,并采用 Monty Carlo Tree Search 策略和 GNN 结合进行训练,实验结果表明在满足约束条件方面有 44% 的改进。