通过过程环境生成进行情境对话学习

ACLOct, 2021

通过过程环境生成进行情境对话学习

Situated Dialogue Learning through Procedural Environment Generation

Prithviraj Ammanabrolu, Renee Jia, Mark O. Riedl

TL;DR通过在生成的课程上训练，我们教会了目标驱动型智能体在位置化环境中交互行为和语言表达。我们通过在大规模众包幻想文本冒险游戏（LIGHT）中学习，增强了 LIGHT 的功能，并学会了生成额外的小说文本世界和任务，以创建一个渐进式递增难度的课程，以训练智能体达到这样的目标。通过从分布的尾部学习，我们测量该课程的难度，根据最初的训练分布中任务的稀有程度评估其难度 —— 更容易的环境是更有可能在未增强数据集中找到的环境。消融研究表明，从分布的尾部学习的这种方法，可以在从未见过的任务上度量的零 - shot 性能方面，产生显着更高的泛化能力。

Abstract

We teach goal-driven agents to interactively act and speak in situated environments by training on generated curriculums. Our agents operate in LIGHT (Urbanek et al. 2019) -- a large-scale crowd-sourced fantasy text adv

goal-driven agents textual natural language curriculum learning generalization abilities fantasy text adventure

发现论文，激发创造

在奇幻文本冒险游戏中学习说话和行动

本文介绍了一个大规模的众包文字冒险游戏作为研究平台，用于研究基于场景的对话。在其中，代理可以感知，表情和行动，同时与其他代理进行对话。我们介绍了在这种情况下训练最先进的生成模型和检索模型的结果。我们展示了除了过去的对话，这些模型还能够有效地使用潜在世界的状态来调整它们的预测，特别是使用本地环境的详细信息，包括位置描述和其中存在的对象（及其可用性）和角色（及其先前的行动），可以更好地预测代理行为和对话。我们分析了在这种设置中成功落地所需的要素，以及每个因素如何与能够成功说话和行动的代理相关。

Mar, 2019

如何激励你的巨龙：教授目标驱动型智能体在奇幻世界中说话和行动

使用大规模语言建模和常识推理的预训练来提高多代理之间的沟通，使用 RL 系统平衡行动和对话并结合人工操作进行零样本评估。

Oct, 2020

使用文本生成互动式世界

本文介绍了一种用于生成游戏世界的机器学习方法，通过基于多人文本冒险游戏环境 LIGHT 的内容，利用基于神经网络的模型将位置、角色和对象组成一个连贯的整体。除了基于现有元素创建世界，该模型还可以生成新的游戏内容，提供了交互式辅助世界构建的方法，研究表明，我们的方法可以创造出具有连贯性与多样性的游戏环境，人类评估者也相对于其他机器学习方法更偏爱我们的创造方法。

Nov, 2019

学习基于知识图谱的文本环境世界模型

该论文聚焦于构建基于文本的游戏环境的世界模型，利用知识图谱和自然语言行动生成模型，提升增强学习智能体在该环境下的效率。通过零样本消融实验，表明该方法显著优于现有的文本世界建模技术及其各自贡献的重要性。

Jun, 2021

在二维环境中的交互式基于语境的语言习得和推理

基于 2D 迷宫世界，通过虚拟代理学习语言的模型，将语言的生成与理解与其他计算流程分离，从而成功地解决新单词出现的问题。模型可以解释人类可理解的中间输出结果，大幅优于其他五种比较方法。

Jan, 2018

文本建模世界

该研究提供了一个数据集，用于训练能够构建基于知识图谱的交互叙事世界模型的学习代理。数据集包含了 24198 个富自然语言观察和知识图谱之间的映射，以及多个流派的 27 个游戏中的训练数据和 9 个附加的游戏中包含的 7836 项测试集等内容。此外，研究还提供了基于规则、问答和序列学习方法的基线模型以及数据分析。

Jun, 2021

坐标学习中，智能体该如何提问？：一份带注解的对话语料库

通过收集 Human-Robot Dialogue Learning (HuRDL) Corpus 数据集，提出利用人类角色扮演机器人在在线交互虚拟环境中进行协作任务，描述了对话数据和对应注释方案，为智能代理的提高提出了帮助学习的问题。

Jun, 2021

面向环境和目标驱动的语言学习模式

本文提出一种通用的情境语言学习范式，旨在设计可靠的语言代理以能够与人类进行成功的合作。

Oct, 2016

通过设置器 - 求解器交互自动生成课程

研究探讨了如何在动态的环境下使用自动生成的任务大纲来改善智能体的效果，介绍了使用目标的有效性、可行性和覆盖面的考虑来构建有用的任务大纲的新技术，并在 2D 和 3D 环境中展示了成功应用。

Sep, 2019

环境探险：教授 ChatGPT 开发复杂故事

通过采用大型语言模型的故事生成能力，我们将生成的故事简化并映射为行动序列，以引导智能体进行想象性游戏，并设计了一个文本冒险游戏来模拟智能体在房屋中进行互动，以评估其是否能成功完成想象性游戏。

Aug, 2023