BriefGPT.xyz
Ask
alpha
关键词
locomotion tasks
搜索结果 - 2
ICLR
针对连续控制评估基于模型的规划和规划器分摊
本文探讨了基于模型的控制方法是否能够超越基于数据的方法。研究人员通过将模型预测控制与学习模型和基于数据的策略学习相结合的方式,对多种具有挑战性的运动任务进行了评估,并发现:经过良好调节的基于数据的策略学习代理是高自由度控制问题的强基准。但是
→
PDF
3 years ago
可调步态控制器的学习和迁移
研究一种新的架构和训练程序,通过训练简单的任务,以高频率、低层次的 “脊髓” 网络与本体感觉运动神经元进行学习。这个预训练模块通过修正脊髓网络的输入来驱动行为,从而使学习从稀疏的奖励中得到有效的探索。在三种虚拟体内(16 维游泳蛇、20 维
→
PDF
8 years ago
Prev
Next