Aug, 2023

将 LLM 和决策变压器相结合,实现语言操作的生成与多样共存

TL;DR通过使用大型语言模型扩充轨迹的自然语言描述,我们提出了一种方法来解决质量 - 多样性问题,允许用户指定任意目标行为描述,并通过高层次的文本提示来塑造生成的轨迹。同时,我们还提出了一种基于大型语言模型的评估方法,并使用 2D 迷宫中的模拟机器人导航开发了一种基准测试用于实验验证。