World of Bugs: 3D 视频游戏自动漏洞检测平台

Jun, 2022

World of Bugs: 3D 视频游戏自动漏洞检测平台

World of Bugs: A Platform for Automated Bug Detection in 3D Video Games

Benedict Wilkins, Kostas Stathis

TL;DR我们提出了世界虫子（WOB），这是一个支持视频游戏自动化缺陷检测研究的开放平台。该平台的关键特色是一个共同的视频游戏缺陷收集，可用于训练和评估基于学习的解决方案。

Abstract

We present world of bugs (WOB), an open platform that aims to support automated bug detection (ABD) research in video games. We discuss so

world of bugs automated bug detection video games learning-based solutions abd approaches

发现论文，激发创造

学习如何识别三维视频游戏中的感知缺陷

本论文提出了利用学习方法，基于玩家所看到的渲染游戏屏幕，能够识别一系列感知错误的可能性，从而解决自动化游戏 bug 检测的问题，并且开发了一个名为 “World of Bugs” 的开放平台来测试该方法。

Feb, 2022

UbuntuWorld 1.0 LTS - Ubuntu 操作系统自动化问题解决和故障排除平台

本文介绍了 UbuntuWorld 1.0 LTS 平台，该平台旨在开发 Ubuntu 操作系统自动技术支持代理。我们使用 Bash 终端作为 Ubuntu 环境的模拟器，演示了采用强化学习技术来解决该环境中的基本问题解决和故障排除的实用性，并提供了插入和评估不同类型代理的 Python 包的接口。使用在线支持论坛（如 AskUbuntu）的数据来集成自动代理学习过程，最后证明使用此数据能够显著提高代理学习效果。我们认为该平台可以作为自动技术支持研究的实际测试基地。

Sep, 2016

使用 LSTM 网络自动检测游戏中的错误

我们提出了一个新的框架，使用长短期记忆（LSTM）网络来检测感知缺陷，将视频游戏中的缺陷检测为异常，并通过聚类来确定发生的缺陷类别。该框架在两个第一人称射击游戏上进行了评估，结果显示了框架的有效性。

Dec, 2023

DeepBugs: 一种基于命名的缺陷检测学习方法

本文介绍了一种基于 DeepBugs 的学习方法，结合了自然语言元素和语义表示进行代码中的错误检测，并通过简单的代码转换生成了可能的错误代码示例，应用该方法到 150,000 个 JavaScript 文件中，获得了高准确率的错误检测结果。

Apr, 2018

基于 LLM 的文本游戏自动错误检测

通过基于大型语言模型的方法，我们提出了一种自动识别互动游戏中逻辑和设计缺陷的系统化方法，该方法应用于文本游戏 DejaBoom! 上能够高效地识别大型语言模型驱动的互动游戏中的缺陷，并填补了自动检测逻辑和设计缺陷的空白。

Jun, 2024

VeriBug：一个基于注意力机制的硬件设计中的错误定位框架

通过深度学习加速芯片设计的调试过程，在硬件设计周期中生成出现故障的可能原因的解释，并突出显示潜在的故障源代码，实验表明其可实现对开源设计和不同类型注入故障的平均故障定位覆盖率为 82.5%。

Jan, 2024

大型语言模型是相当不错的零样本视频游戏缺陷检测器

本研究探讨了利用大型语言模型的零样本能力来进行视频游戏中漏洞检测的可能性，并将漏洞检测问题表述为问答任务。我们介绍了 GameBugDescriptions 基准数据集，展示了六个模型在该数据集上的表现。结果表明，使用适当的提示技术，我们可以在某些游戏中实现高达 78.94％的准确度，为视频游戏漏洞检测提供了积极的前景。

Oct, 2022

自动化可达性测试：在复杂的 3D 游戏环境中探索

通过在游戏的导航网格上使用基于 Go-Explore 算法的简单启发式算法，以及并行处理器，实现了在测试游戏中发现难以察觉的到达性缺陷和全面探索复杂环境的目的，避免了需要人工演示或了解游戏动态的需求。Go-Explore 在覆盖导航网格和发现地图上的独特位置方面比包括驱动好奇心的强化学习在内的更复杂基线表现更好。

Sep, 2022

BugBlitz-AI: 一位智能 QA 助手

软件测试从手动到自动化方法的演变在质量保证实践中产生了重大影响，BugBlitz-AI 是一种基于人工智能的验证工具包，旨在通过自动化结果分析和错误报告生成来增强端到端的测试自动化，提高产品质量和快速上市时间。

May, 2024

红外：元虫侦测器

本文提出了一种名为元 Bug 检测的新方法，相比传统的静态分析工具和现有的基于学习的 Bug 检测工具，元 Bug 检测具有三个关键优势：泛型、自解释和样本效率。对该方法进行的全面评估表明，它能够有效地捕捉多种类型的 Bug，包括空指针解引用、数组下标越界、文件句柄泄漏以及并发程序中的数据竞争，并且优于 Facebook Infer 和 FICS 等基准方法。

Sep, 2022