Sep, 2023

一个离线强化学习的真实四足行动基准

TL;DR以离线强化学习方向研究四足机器人腿部鲁棒动作,通过经典模型预测控制方法收集数据集,并与基于模型无关的在线强化学习方法进行对比,发现离线强化学习算法在某些任务上能够超越模型无关的在线强化学习算法,但在稳定性和快速适应性方面仍存在差距,该研究为测试和评估离线强化学习算法在实际四足机器人运动任务中的表现提供了一个发展平台。