Nov, 2023

基于估计器耦合的强化学习用于稳定纯触觉手内操纵

TL;DR通过训练过程中将控制策略与状态估计器耦合,本文解决了将强化学习控制器和状态估计器简单组合的问题,实现了对具有挑战性的纯触觉、目标条件、手部重新定位任务的高性能,同时保持比端到端策略学习更好的可解释性优势。