ACLJun, 2024

基于 LLM 的文本游戏自动错误检测

TL;DR通过基于大型语言模型的方法,我们提出了一种自动识别互动游戏中逻辑和设计缺陷的系统化方法,该方法应用于文本游戏 DejaBoom! 上能够高效地识别大型语言模型驱动的互动游戏中的缺陷,并填补了自动检测逻辑和设计缺陷的空白。