BriefGPT.xyz
Ask
alpha
关键词
distributionally robust markov decision processes
搜索结果 - 2
大型状态空间下的分布鲁棒基于模型的强化学习
提出了一种基于高斯过程和最大方差缩减算法的模型基础方法,用于学习多输出名义转移动力学,克服了强化学习中的若干挑战,并在分布移位方面展示了算法的鲁棒性以及样本数量上的优越性。
PDF
10 months ago
强化学习中生成模型分布稳健性的研究
研究强化学习中模型鲁棒性以减少实践中的模拟与实际之间的差距,采用分布鲁棒马尔可夫决策过程的框架,在规定的不确定性集合范围内学习最优性能策略,对于不同的不确定性集合,分别用基于模型的方法分析分布鲁棒价值迭代的采样复杂性,结果表明分布鲁棒马尔可
→
PDF
a year ago
Prev
Next