Jul, 2023

分解任务:基于单元级别的混合训练框架用于视觉和语言决策

TL;DR本研究提出了一种基于 Unit-Transformer 的混合训练框架,将 Vision language decision making 任务分解为可管理的单元,并通过活跃的环境探索和内部循环状态来改进模型,最终取得优于现有方法的成果。