BriefGPT.xyz
Jun, 2022
精确组合优化的深度强化学习:学习分支
Deep Reinforcement Learning for Exact Combinatorial Optimization: Learning to Branch
HTML
PDF
Tianyu Zhang, Amin Banitalebi-Dehkordi, Yong Zhang
TL;DR
本文提出一种基于强化学习的方法用于解决组合优化中的数据标记和推理延迟问题,并使用蒙特卡罗树搜索和价值网络提高策略网络的性能表现。作者在四种不同类别的组合优化问题上进行了评估,结果表明该方法相较于现有机器学习和启发式方法有更优的性能表现。
Abstract
Branch-and-bound is a systematic enumerative method for
combinatorial optimization
, where the performance highly relies on the
variable selection
strategy. State-of-the-art handcrafted heuristic strategies suffer
→