Aug, 2023

关于在图上的组合优化中的 QUBO 基于哈密顿函数用于 Max Cut (MC) 问题的研究

TL;DR利用强化学习与哈密顿函数结合的方法在二次无约束二进制优化(QUBO)问题中处理组合优化问题。使用图神经网络作为节点之间信息传递的消息传递架构,并使用 Monty-Carlo Tree Search with GNN-based RL(MCTS-GNN)、DQN with GNN-based RL 和 GRL 三种结构进行研究。发现 RL 范式中,QUBO 公式中基于哈密顿函数的优化可以带来模型收敛,并可作为通用的奖励函数;并通过对不同密度图上的实验,从违反约束、学习稳定性和计算成本的角度比较了不同结构的性能。