语言引导的世界模型：一种基于模型的人工智能控制方法

Jan, 2024

语言引导的世界模型：一种基于模型的人工智能控制方法

Language-Guided World Models: A Model-Based Approach to AI Control

Alex Zhang, Khanh Nguyen, Jens Tuyls, Albert Lin, Karthik Narasimhan

TL;DR安装概率世界模型到人工智能代理中，为人类与控制这些代理打开了一个高效的交流途径；我们开发了一种名为语言引导的世界模型（LWMs），通过阅读语言描述来捕捉环境动态，提高了代理的通信效率，同时允许人类用简洁的语言反馈在多个任务中同时改变行为。该研究证明了当前最先进的 Transformer 架构在该基准测试上表现不佳，激励我们设计更强大的架构。通过模拟展示了我们提出的 LWMs 的实用性，使代理能够在执行前生成和讨论计划，增强了代理的可解释性和安全性，并使其在真实环境中的性能提高了三倍，而无需在该环境中进行任何交互式经验的收集。

Abstract

Installing probabilistic world models into artificial agents opens an efficient channel for humans to communicate with and control these agents. In addition to updating agent policies, humans can modify their internal world models in order to influence their decisions. The challenge, h

probabilistic world models language-guided world models agent communication efficiency transformer architecture interpretability and safety of an agent

发现论文，激发创造

LanGWM: 语言引导的世界模型

通过语言为鲁棒的动作选择增强状态抽象技术，利用语言为基础的视觉特征来改进强化学习中的世界模型学习，提高对于复杂任务中的视觉控制的推广性。

Nov, 2023

利用世界模型进行紧急通信

引入了一种 Language World Models 的生成式模型，用于预测未来观测的潜在代码，提高了对语言信息的理解能力，进而提高了 2D 栅格世界的语音导航任务的任务成功率。

Feb, 2020

语言模型遇上世界模型：具身体验增强语言模型

本文提出了一种通过 fine-tuning 使用世界模型使大型自然语言模型获得基于物理环境的知识和技能，以帮助解决模型在简单的推理和规划中的局限性，实验证明这种方法能够提高基本的 LM 在 18 项下游任务上的性能，尤其是 1.3B 和 6B 的小 LM。

May, 2023

学习基于知识图谱的文本环境世界模型

该论文聚焦于构建基于文本的游戏环境的世界模型，利用知识图谱和自然语言行动生成模型，提升增强学习智能体在该环境下的效率。通过零样本消融实验，表明该方法显著优于现有的文本世界建模技术及其各自贡献的重要性。

Jun, 2021

语言模型、代理模型和世界模型：机器推理和规划之 LAW

我们提出了一个新的机器推理角度：LAW，连接了语言模型、代理模型和世界模型的概念，以增强其推理能力。我们将世界和代理模型视为更好的推理抽象，引入了人类推理的关键元素，包括对世界和其他代理的信念，后果的预测，目标 / 奖励和战略规划。在 LAW 框架下，语言模型被用作实现系统或其元素的后端，从而提供计算能力和适应性。我们回顾了最近取得的相关进展，并讨论了将 LAW 框架操作化的未来研究方向。

Dec, 2023

语言模型作为代理模型

语言模型仅通过文本训练，但仍然可以推断和表示产生语境的人的代理人属性，包括细粒度的交际意图和抽象的信仰和目标，并被用于构建通信和行为系统。

Dec, 2022

BWArea 模型：学习世界模型，逆动力学和策略用于可控语言生成

通过从人类大脑的神经机制，如 Broca 区和 Wernicke 区获取灵感，我们提出了 BWArea 模型，该模型将语言生成视为决策任务，其预训练性能不会因聚集到的错误数据而退化，并通过微调与下游奖励度量相结合来实现更好的可控性和性能。

May, 2024

基于大语言模型的对话式生成自动驾驶仿真场景

本文描述了一个支持扩展多模态交互的系统，通过使用大型语言模型 (LLMs) 将用户的英语语句映射到领域特定的代码，我们探索了 LLMs 在上下文敏感性方面捕捉演算发言者意图的程度。

Oct, 2023

带有世界知识模型的 Agent 规划

使用大型语言模型作为代理模型来执行交互式规划任务已取得令人称赞的结果。本文引入了参数化的世界知识模型（WKM）来促进代理规划，通过从专家和采样轨迹中自我合成知识，并提供全局任务知识和动态状态知识来指导全局规划和辅助局部规划。实验证明我们的方法在复杂的真实世界模拟数据集上相比强基线能够取得优越性能，减轻了盲目试错和幻觉行为问题，为代理对世界的理解提供了有力支持，同时表明了 WKM 具有更好的泛化性能、弱 WKM 能指导强代理模型的规划，并且统一的 WKM 训练具有进一步发展的潜力。

May, 2024

大型知识模型：视角与挑战

人类对世界的理解与我们的感知和认知密切相关，其中人类语言作为世界知识的重要承载者之一。本文通过 “知识” 这个视角来探索大型模型，并讨论符号知识如何增强大型语言模型以及大型语言模型如何扩展传统符号知识基础。考虑到人类知识的复杂性，我们倡导创建专门管理多样化知识结构的大型知识模型，并提出了五个 “A” 原则来区分 LKM 的概念。

Dec, 2023