Feb, 2023

基于模拟与实际强化学习的机器人操作:一种基于一致性的方法

TL;DR本文提出了一个基于深度强化学习的机器人pick-and-place任务的共识型模拟现实联合训练算法(CSAR),目的是在模拟和实际环境中都实现高效和有效的策略优化。实验表明,模拟中的最佳策略并不一定适用于模拟和实际环境的学习。同时,越多的模拟代理越有利于模拟现实的训练。