Sep, 2024

未知环境中机器人动态优化的因果强化学习

TL;DR本研究解决了机器人在未知环境中操作时缺乏对交互动态知识的问题。提出了一种新的因果强化学习方法,应用于城市搜索与救援场景,帮助机器人学习视觉特征与物体动态之间的因果关系,从而显著改善决策过程。实验结果表明,与非因果模型相比,该方法在复杂情况下学习时间减少超过24.5%。