Sep, 2023

通过可区分的硬件模型代理使用强化学习的设计协同优化(MORPH)

TL;DR我们介绍了一种使用强化学习在模拟中对硬件设计参数和控制策略进行联合优化的方法 MORPH。MORPH 依赖于被优化的硬件模型,通常是基于物理定律进行模拟,为了有效地集成此类模型,我们引入了一个可微分的代理硬件模型,通过 RL 可以有效地进行联合优化,保证优化后的代理硬件尽可能接近真实情况,同时实现任务完成。我们在模拟的 2D 触及和 3D 多指操纵任务上展示了我们的方法。