May, 2022

使用Tree MDPs进行分支学习

TL;DR本文通过强化学习的方法,提出了树马尔科夫决策过程的概念,从头学习分支规则,并通过计算实验证明了树马尔科夫决策过程对于MILP中学习分支问题具有更好的收敛性能。