BriefGPT.xyz
Ask
alpha
关键词
queue scheduling
搜索结果 - 1
约束马尔可夫决策过程的原始对偶方法
本文提出了一种基于采样的原始 - 对偶算法来解决带约束的马尔科夫决策过程,通过应用正则化策略迭代来改善策略,应用次梯度上升来保持约束。在弱耦合结构的情况下,通过嵌入式分解方法,能够显著减少问题的维度。将算法应用于多产品库存管理和多类队列调度
→
PDF
3 years ago
Prev
Next