Mar, 2024

SELFI: 自主社会导航自我提升的强化学习

TL;DR提出了一种名为SELFI的在线学习方法,该方法通过在离线模型训练的基础上运用在线无模型强化学习来快速优化预先训练的控制策略,以实现自主自我改进的机器人行为,并在实际环境中进行评估,展示出在避免碰撞和更社会合规行为方面的改进。