Jun, 2024

带大型语言模型线索的世界模型用于目标实现

TL;DR通过将提出的具有示意性子目标的语言模型与模型回滚相结合,我们提出了一种新的多模态的基于模型的强化学习方法,名为大语言模型梦境,用以鼓励在具有挑战性任务中发现和达成目标,从而对各种困难的、稀疏奖励的环境进行了大量实验,并显示出优于近期方法的性能提升。