BriefGPT.xyz
Ask
alpha
关键词
model-based meta-reinforcement learning
搜索结果 - 1
基于元模型的元策略优化
本文通过将 Janner 等人 (2019) 提出的定理扩展,分析了基于模型的元强化学习方法的性能保证,并提出了具有性能保证的 Meta-Model-Based Meta-Policy Optimization (M3PO),证明 M3PO
→
PDF
4 years ago
Prev
Next