Jan, 2023

具身化智能体是否会梦见像素化的绵羊?:利用语言引导的世界建模进行具身决策

TL;DR使用大型语言模型来假设抽象世界模型从而提高强化学习代理的样本效率。在 Minecraft 物品制作中,DECKARD 代理通过 LLM-guided exploration 提出 AWM 并验证其有效性,从而实现了与现代方法相比一个数量级的提升。