Jul, 2024

陌生人危险!基于RL的社交机器人导航中的识别与避让不可预测行人

TL;DR通过改进学习流程,我们提出了一种社交注意力强化学习(SARL)策略,该策略在不熟悉情况下能够保持足够的谨慎,并通过修改训练过程、更新价值网络和实现奖励函数等方式,有效减少碰撞和减少人行道上个体空间的占用时间。