May, 2024

ClothPPO:一个增强机器人布料操纵的近端策略优化框架,使用与观测对齐的动作空间

TL;DR本文介绍了基于视觉的机器人布料展开的研究,引入了一个基于策略梯度算法和演员-评论家架构的框架ClothPPO,通过优化和更新策略,提高了软体操作任务下布料展开的表现。实验结果表明,我们的方法可以进一步改善其他最先进方法的展开性能。