Apr, 2022

应对挑战环境中机器人探索的在线自适应无导数评估

TL;DR该论文介绍了一种基于状态价值函数、离线蒙特卡罗训练和基于传感器信息的内在奖励函数的机器人探索方法,该方法能够更好地预测未来状态的价值以更好地指导机器人探索,在挑战性的地下和城市环境中首次应用于真实世界数据集中。