Mar, 2025

RIG:在端到端通用政策中协同推理与想象

TL;DR本研究解决了嵌入式代理在复杂开放世界环境中面临的推理和想象能力缺乏整合的问题。论文提出了一种名为RIG的全新端到端通用政策,通过构建数据管道实现推理与想象的协同学习,从而显著提高样本效率和泛化能力。实验结果显示,该方法增强了通用政策的鲁棒性和互操作性,为提升整体性能提供了可能性。