ICLRMar, 2024

在线持续学习的交互式指导跟随代理

TL;DR本研究探讨了实体代理通过语言指令执行日常任务的学习过程,提出了两种持续学习设置(行为增量学习和环境增量学习),并使用置信度感知滑动平均方法(CAMA)更新过去任务的信息,从而在实证验证中取得比现有方法更好的效果。