关键词control policy
搜索结果 - 13
- 高效深度多智能体强化学习的表示学习PDFa month ago
- 从果蝇到机器人:具有动态停歇的小型四轴飞行器的倒立着陆PDF4 months ago
- 马尔可夫决策过程中无界每步成本的模型近似PDF5 months ago
- COMPOSER: 蛇形机器人的可扩展和稳健的模块化策略PDF9 months ago
- 基于强化学习的液压工程机械远程操作虚拟固定装置PDFa year ago
- 联邦式集合指导下的离线强化学习PDFa year ago
- 从逐步优化策略梯度的角度重新审视 LQR 控制PDFa year ago
- 结合模仿与强化学习的减少基线遗憾度框架PDF2 years ago
- 使用深度强化学习进行多资产闭环水库管理PDF2 years ago
- 基于音乐的在线游戏关卡生成PDF2 years ago
- 使用知识图谱进行深度强化学习的迁移学习PDF5 years ago
- 稀疏表示在强化学习控制中的应用PDF6 years ago
- 深度强化学习联合学习构造和控制智能体PDF7 years ago
Prev
Next