Jan, 2024

Context-Former: 通过潜在条件序列建模图像拼接

TL;DR通过引入场景信息的模仿学习和序列建模以匹配专家轨迹,并将弱优轨迹片段无缝衔接,我们在离线强化学习中的决策变换器(DT)上提供了 DT 缺乏的衔接能力,实验证明 ContextFormer 在多种模仿学习设置下具有竞争力,超过了其他竞争的 DT 变体,展示了其卓越的性能。