我们提出了世界虫子(WOB),这是一个支持视频游戏自动化缺陷检测研究的开放平台。该平台的关键特色是一个共同的视频游戏缺陷收集,可用于训练和评估基于学习的解决方案。
Jun, 2022
我们提出了一个新的框架,使用长短期记忆(LSTM)网络来检测感知缺陷,将视频游戏中的缺陷检测为异常,并通过聚类来确定发生的缺陷类别。该框架在两个第一人称射击游戏上进行了评估,结果显示了框架的有效性。
Dec, 2023
利用无标签游戏过程和领域特定增强方法生成预训练或多任务设置中使用的自我监督目标数据集,以解决传统测试方法在检测视频游戏中潜在错误方面的困难。通过弱监督方法扩大数据集规模,并结合无监督聚类和基于文本和几何提示的交互方法,有效提高了对大型视觉错误的检测能力。
Sep, 2023
通过基于大型语言模型的方法,我们提出了一种自动识别互动游戏中逻辑和设计缺陷的系统化方法,该方法应用于文本游戏 DejaBoom! 上能够高效地识别大型语言模型驱动的互动游戏中的缺陷,并填补了自动检测逻辑和设计缺陷的空白。
Jun, 2024
通过自动化测试和自动计划行动模型学习技术,本文提出了一种用于测试特定视频游戏方面的方法和工作流。该方法和工作流允许游戏开发人员和 PDDL 建模经验者之间的高效合作,以实现对计划领域描述语言 (PDDL) 的正式模型的生成,从而通过在 Unity 游戏开发引擎中提供的简单的角色扮演游戏的教程项目进行演示。本文是向流程中建模专家的职位需求降到最低甚至消除的第一步,从而使自动计划可以更广泛地被应用。
Feb, 2024
本研究提出了一种基于数据驱动的模仿学习技术的自动游戏验证和测试方法,该方法需要很少的工作量和时间,设计师们可以用它来高效地训练游戏测试代理。研究结果表明,我们的方法确实是一种有效的游戏验证方法,数据驱动编程也将是减少游戏测试工作量和提高现代游戏测试质量的有用辅助工具。
Aug, 2022
本文介绍了一种基于 DeepBugs 的学习方法,结合了自然语言元素和语义表示进行代码中的错误检测,并通过简单的代码转换生成了可能的错误代码示例,应用该方法到 150,000 个 JavaScript 文件中,获得了高准确率的错误检测结果。
Apr, 2018
本文提出了一种名为元 Bug 检测的新方法,相比传统的静态分析工具和现有的基于学习的 Bug 检测工具,元 Bug 检测具有三个关键优势:泛型、自解释和样本效率。对该方法进行的全面评估表明,它能够有效地捕捉多种类型的 Bug,包括空指针解引用、数组下标越界、文件句柄泄漏以及并发程序中的数据竞争,并且优于 Facebook Infer 和 FICS 等基准方法。
Sep, 2022
通过在游戏的导航网格上使用基于 Go-Explore 算法的简单启发式算法,以及并行处理器,实现了在测试游戏中发现难以察觉的到达性缺陷和全面探索复杂环境的目的,避免了需要人工演示或了解游戏动态的需求。Go-Explore 在覆盖导航网格和发现地图上的独特位置方面比包括驱动好奇心的强化学习在内的更复杂基线表现更好。
本研究探讨了利用大型语言模型的零样本能力来进行视频游戏中漏洞检测的可能性,并将漏洞检测问题表述为问答任务。我们介绍了 GameBugDescriptions 基准数据集,展示了六个模型在该数据集上的表现。结果表明,使用适当的提示技术,我们可以在某些游戏中实现高达 78.94%的准确度,为视频游戏漏洞检测提供了积极的前景。
Oct, 2022