Dec, 2023

视觉强化学习泛化的可靠双向过渡模型表示

TL;DR基于可靠的双向预测环境转换能力,我们引入了一个双向转换(BiT)模型,从视觉观察中提取可靠的表示形式,展现出了竞争力的泛化性能和样本效率。