图像胜千言：语言模型基于像素进行规划

Mar, 2023

图像胜千言：语言模型基于像素进行规划

A Picture is Worth a Thousand Words: Language Models Plan from Pixels

Anthony Z. Liu, Lajanugen Logeswaran, Sungryull Sohn, Honglak Lee

TL;DR本文研究利用预训练的语言模型（PLMs）从文本指令中推理出在具体视觉环境下的计划序列，结果表明 PLMs 能够准确地规划，且强于其他方法。

Abstract

Planning is an important capability of artificial agents that perform long-horizon tasks in real-world environments. In this work, we explore the use of pre-trained language models (PLMs) to reason about plan sequences<

pre-trained language model plan sequences artificial agents visual environments alfworld

发现论文，激发创造

基于视觉理解规划的语言模型无需视觉输入推断详细计划

本文研究了如何将自然语言指令转化为虚拟环境中可行的多步骤行动序列，通过实证表明，结合一定的视觉信息和上下文语境，GPT-2 模型能够成功地生成金标准语句执行序列，为基于语言的虚拟代理提供了强大的视觉语义规划模块。

Sep, 2020

规划、消除和跟踪 —— 语言模型是装备智能体的良师益友

使用大型语言模型的知识来简化控制问题，而不是直接解决它，作者提出了 Plan, Eliminate, and Track (PET) 框架，并在 AlfWorld 指令跟随基准测试中取得了显着的 15% 性能提升。

May, 2023

理解大型语言模型在自动化规划方面的能力

该研究旨在探讨大型语言模型在自动计划中的应用，研究包括使用何种预训练数据最有效、微调或提示哪种方法最有效以及大型语言模型能否进行计划综合。

May, 2023

LLM-Planner: 借助大型语言模型进行少样本基于实例的具身 agent 规划

本研究使用大型语言模型 (Large Language Models, LLMs) 作为规划师，以完成视觉感知环境中的复杂任务的具有身体接口的代理人。研究提出了 LLM-Planner 方法进行 few-shot planning，同时提出通过物理接口增强 LLMs 的简单而有效的方法，实验结果表明该方法在 ALFRED 数据集上能够取得与使用全数据训练的基线模型相当的性能。

Dec, 2022

预训练语言模型的剧情写作

提出了一种新方法 ScratchPlot，使用 Pre-trained language models，利用 content planning 生成故事情节，并使用 generate-and-rank approach 对所生成的（story, ending）pairs 进行排序。实验表明，在人类评估和自动评估中都获得了更好的结果。

Jun, 2022

大型语言模型作为规划领域生成器

通过对 7 个大型语言模型进行实证分析，我们发现大型语言模型在从自然语言描述中生成正确的规划领域模型方面具有适中的能力。

Apr, 2024

视觉语言模型为强化学习提供可提示的表示

通过利用背景世界知识，人类能够快速学习新的行为方式。相比之下，强化学习训练的代理通常需要从零开始学习行为。因此，我们提出了一种新的方法，利用基于视觉语言模型（VLMs）的通用世界知识和可索引知识，这些模型在互联网规模的数据上进行预训练，用于实体强化学习。我们通过将 VLMs 用作可提示的表示方式来初始化策略：通过提示提供任务背景和辅助信息，这些嵌入基于视觉观察进行了接地，并编码了 VLM 的内部知识的语义特征。我们在 Minecraft 中的视觉复杂、长期的强化学习任务以及 Habitat 中的机器人导航任务上评估了我们的方法。我们发现，与从通用的非可提示图像嵌入训练的等效策略相比，我们基于通用 VLMs 提取的嵌入的训练策略表现更好。我们还发现，我们的方法优于遵循指令的方法，并与特定领域的嵌入方法效果相当。

Feb, 2024

LaMPP: 语言模型作为感知和行动的概率先验

使用自然语言处理模型，我们将标签和决策转化成基于概率图模型的推断，进而实现对语义分割、家庭导航和活动识别任务的精确预测，提高对于罕见、不常见以及结构新颖输入的预测能力。

Feb, 2023

知识增强的预训练语言模型：综述

本文论述了预训练语言模型（PLM）的重要性以及知识增强型预训练语言模型（KE-PLMs）的研究现状，探讨了 KE-PLMs 在各种 NLU 和 NLG 应用中的超越性能以及 KE-PLMs 面临的挑战和未来研究方向。

Oct, 2021

PlaSma: 将小型语言模型转化为更好的规程知识模型，用于（反事实的）规划

本文提出了 PlaSma，一种利用小型语言模型赋予程序化知识和（反事实的）规划能力的新方法，并介绍了计划的符号化程序知识蒸馏和推理时间算法以及一个新的任务，即对计划进行修订以应对反事实情况的 “反事实规划”，并展示了在原始和反事实情况下，规模比大的教师模型（770M-11B 参数）小几个数量级的模型可以达到甚至超越它们的能力。

May, 2023