BriefGPT.xyz
Ask
alpha
关键词
mujoco datasets
搜索结果 - 1
ICLR
离线策略评估和优化的自回归动态模型
提出了一种基于自回归动力学模型的控制模型,分析了其在离线数据集 RL Unplugged 中的表现,证明其在策略优化中具有潜在应用。
PDF
3 years ago
Prev
Next