Jul, 2022

互动强化学习中反馈频率对于机器人任务的影响量化

TL;DR本文研究了交互反馈频率对强化学习在连续状态和动作空间的机器人任务中的影响,证明了随着机器人操作熟练度的提高应该改变反馈频率而不是坚持使用单一的最佳反馈频率。