Jun, 2023

SPRINT:可伸缩的策略预训练,通过语言指导的标签化

TL;DRSPRINT提出了一种可扩展的离线策略预训练方法,通过使用大规模语言模型和离线强化学习,自动扩展预训练任务集合以训练机器人一系列技能,实验结果表明,SPRINT预训练明显加速了机器人学习新任务的速度。