May, 2022

使用记忆编辑在强化学习中学习用户定义的子目标

TL;DR通过记忆编辑等技术,实现了强化学习中的控制代理实现中间子目标的方法,可广泛应用于需要在多种场景下控制代理的领域。