Jul, 2024

在虚拟环境中的目标条件强化学习指令跟踪

TL;DR本研究提出了一个层次化的框架,结合大型语言模型的深度语言理解和强化学习代理的自适应执行能力,以使人工智能代理能够在虚拟环境中执行复杂的语言指令,并成功实现所需的结果。该框架在两个不同的环境中展示了其有效性:在IGLU中,代理被指示建造结构;在Crafter中,代理根据语言指令在周围环境中执行任务并与物体交互。