Jun, 2022

社交机器人的变分元强化学习

TL;DR本研究探讨利用元强化学习方法来通过各种奖励函数快速适应机器人所处的不同环境,提高社交机器人的行为表现,并通过径向基函数图层降低后验坍塌负面影响。