Nov, 2023

LanGWM: 语言引导的世界模型

TL;DR通过语言为鲁棒的动作选择增强状态抽象技术,利用语言为基础的视觉特征来改进强化学习中的世界模型学习,提高对于复杂任务中的视觉控制的推广性。