BriefGPT.xyz
Ask
alpha
关键词
tree markov decision process
搜索结果 - 1
TreeDQN:学习最小化分枝定界树
本文介绍了一种基于强化学习的组合优化问题解决方法,使用树马尔可夫决策过程视角选择变量分支,并且优化学习对象,相较之前的强化学习方法,训练数据量更小,生成树的大小更小。
PDF
a year ago
Prev
Next