Oct, 2022

从游戏到政策:基于未筛选机器人数据的条件行为生成

TL;DR本文提出了一种名为 C-BeT 的新方法,结合了 Behavior Transformer 多模态生成能力和条件生成模型技术,实现从多模态、嘈杂数据中提取有用、任务中心的行为,取得了有益的效果,而该方法也是第一个实现从无标签、零奖励信息的玩耍数据里纯学习真实世界机器人有用任务行为的方法。