CALYPSO: LLM作为地牢主持人的助手
本篇论文将 Dungeons and Dragons 视为一个对话系统的挑战问题,通过创建一个包含近 900 场游戏的游戏数据集以及使用大型语言模型生成对话来测试模型的性能,并通过人工评估和自动评估来判断其质量。
Oct, 2022
该研究提出了一个基于角色扮演游戏Dungeons and Dragons的新任务G4C(Goal-driven Guidance Generation in Grounded Communication),通过满足学习者的目标来培养具有人类思维想象力的DM(Dungeon Master),实现在基于语境的自然语言交互中DM对学生进行有效指导的训练方法。
Dec, 2022
本研究介绍了FIREBALL数据集,将真实Dungeons & Dragons游戏信息与自然语言生成相结合,并展示了该数据集可以提高自然语言生成的质量和可执行的命令。
May, 2023
本文探索了一种方法,即在特定的游戏场景中测试大型语言模型的表现,以此来深入了解它们是否能像环境理解代理一样进行操作,涵盖了五个交互设置,并表明当前聊天优化的大型语言模型在一定程度上能够遵循游戏规则,并且用于衡量游戏表现和调查LLM的性能具有诊断价值。
May, 2023
本研究通过利用大规模训练语料库中角色知识,提出了一种自对齐的角色扮演方法 Ditto,其将一个在读解问题上进行指令遵循的大型语言模型调整为模拟角色扮演对话。通过使用自动生成的角色扮演训练数据集对模型进行微调,Ditto展现出在多轮对话中一致的角色身份和准确的角色特定知识,性能高于其他开源角色扮演基准,并与先进的专有聊天机器人相媲美。与此同时,研究还展示了大型语言模型自身的内在能力限制了角色特定知识的获取,但通过辅助较小模型的指导可以轻松获得角色扮演风格。
Jan, 2024
基于近年来大型语言模型 (LLMs) 在游戏设计、开发和研究中的潜力,本文针对与游戏相关的 LLM 的最新研究进行了初步调研,总结了2022年至2024年初间与 LLMs 和视频游戏相关的76篇论文,主要关注游戏人工智能、游戏开发、叙事以及游戏研究和评论,为未来的研究和评论奠定了基础。
Mar, 2024
近期,大型语言模型的出现为过程性内容生成带来了新的机遇。这篇论文探讨了通过大型语言模型生成游戏的可能性,提出了一种基于视频游戏描述语言的大型语言模型框架,可以同时生成游戏规则和关卡。实验结果展示了这个框架如何根据不同的上下文进行生成,为过程性内容生成领域中的新游戏生成提供了新的见解。
Apr, 2024
大型语言模型在决策中是否可以替代人类是一个近期的研究课题。本研究中,我们通过使用高质量小说中的人物分析数据构建了LIFECHOICE数据集,并进行了多项实验,研究了LLMs在以人物为驱动的决策中的能力。结果表明,目前的LLMs在此任务中显示出有希望的能力,但仍有很大的改进空间。因此,我们进一步提出了基于人物记忆检索的CHARMAP方法,通过该方法可以获得6.01%的准确率提升。我们将公开提供我们的数据集和代码。
Apr, 2024