Oct, 2021

工业插入离线元强化学习

TL;DR本文介绍了一种快速适应新任务的元学习框架,通过先前任务学习自适应,专注于工业插入任务,并结合上下文元学习和在线微调处理了传统元强化学习方法所需的在线元训练,成功率达 100%。