CALYPSO: LLM作为地牢主持人的助手

Aug, 2023

CALYPSO: LLMs as Dungeon Masters' Assistants

Andrew Zhu, Lara J. Martin, Andrew Head, Chris Callison-Burch

TL;DR本研究探讨了大型语言模型在Dungeons & Dragons游戏以及桌面游戏中的使用情况，并介绍了CALYPSO系统，该系统利用大型语言模型提供信息和灵感支持给Dungeon Master，以帮助解决他们在游戏过程中的多项任务和创作需求。

Abstract

The role of a dungeon master, or DM, in the game dungeons & dragons is to perform multiple tasks simultaneously. The DM must digest information about the game setting and monsters, synthesize scenes to present to

发现论文，激发创造

龙与地下城：人工智能对话挑战

本篇论文将 Dungeons and Dragons 视为一个对话系统的挑战问题，通过创建一个包含近 900 场游戏的游戏数据集以及使用大型语言模型生成对话来测试模型的性能，并通过人工评估和自动评估来判断其质量。

Oct, 2022

一名AI地牢大师的指南：学习在龙与地下城（Dungeons and Dragons）中使用意图和心智理论进行对话和指导

该研究提出了一个基于角色扮演游戏Dungeons and Dragons的新任务G4C（Goal-driven Guidance Generation in Grounded Communication），通过满足学习者的目标来培养具有人类思维想象力的DM（Dungeon Master），实现在基于语境的自然语言交互中DM对学生进行有效指导的训练方法。

Dec, 2022

FIREBALL：一份包含结构化游戏状态信息的龙与地下城实际游戏数据集

本研究介绍了FIREBALL数据集，将真实Dungeons & Dragons游戏信息与自然语言生成相结合，并展示了该数据集可以提高自然语言生成的质量和可执行的命令。

May, 2023

clembench: 使用游戏玩法评估对话代理的聊天优化语言模型

本文探索了一种方法，即在特定的游戏场景中测试大型语言模型的表现，以此来深入了解它们是否能像环境理解代理一样进行操作，涵盖了五个交互设置，并表明当前聊天优化的大型语言模型在一定程度上能够遵循游戏规则，并且用于衡量游戏表现和调查LLM的性能具有诊断价值。

May, 2023

大规模语言模型是所有字符的叠加：通过自我对齐实现任意角色扮演

本研究通过利用大规模训练语料库中角色知识，提出了一种自对齐的角色扮演方法 Ditto，其将一个在读解问题上进行指令遵循的大型语言模型调整为模拟角色扮演对话。通过使用自动生成的角色扮演训练数据集对模型进行微调，Ditto展现出在多轮对话中一致的角色身份和准确的角色特定知识，性能高于其他开源角色扮演基准，并与先进的专有聊天机器人相媲美。与此同时，研究还展示了大型语言模型自身的内在能力限制了角色特定知识的获取，但通过辅助较小模型的指导可以轻松获得角色扮演风格。

Jan, 2024

大型语言模型与游戏：调查与路线图

大语言模型（LLMs）在游戏中的应用和角色的综述和路线图，探讨了LLMs在游戏领域中未开发的领域和未来的发展方向。

Feb, 2024

大型语言模型与视频游戏：初步范围评估

基于近年来大型语言模型 (LLMs) 在游戏设计、开发和研究中的潜力，本文针对与游戏相关的 LLM 的最新研究进行了初步调研，总结了2022年至2024年初间与 LLMs 和视频游戏相关的76篇论文，主要关注游戏人工智能、游戏开发、叙事以及游戏研究和评论，为未来的研究和评论奠定了基础。

Mar, 2024

通过LLMs进行游戏生成：视频游戏描述语言的研究

近期，大型语言模型的出现为过程性内容生成带来了新的机遇。这篇论文探讨了通过大型语言模型生成游戏的可能性，提出了一种基于视频游戏描述语言的大型语言模型框架，可以同时生成游戏规则和关卡。实验结果展示了这个框架如何根据不同的上下文进行生成，为过程性内容生成领域中的新游戏生成提供了新的见解。

Apr, 2024

人物塑造命运：大型语言模型能否模拟以角色扮演为驱动的决策？

大型语言模型在决策中是否可以替代人类是一个近期的研究课题。本研究中，我们通过使用高质量小说中的人物分析数据构建了LIFECHOICE数据集，并进行了多项实验，研究了LLMs在以人物为驱动的决策中的能力。结果表明，目前的LLMs在此任务中显示出有希望的能力，但仍有很大的改进空间。因此，我们进一步提出了基于人物记忆检索的CHARMAP方法，通过该方法可以获得6.01％的准确率提升。我们将公开提供我们的数据集和代码。

Apr, 2024

LLM驱动的游戏叙事中的玩家驱动新生

通过与大型语言模型的互动，玩家能够参与游戏叙事的演化，发现有趣且具有吸引力的新节点，进而创造出非原始叙事中不存在的内容。

Apr, 2024