Oct, 2022

大型语言模型是相当不错的零样本视频游戏缺陷检测器

TL;DR本研究探讨了利用大型语言模型的零样本能力来进行视频游戏中漏洞检测的可能性,并将漏洞检测问题表述为问答任务。我们介绍了 GameBugDescriptions 基准数据集,展示了六个模型在该数据集上的表现。结果表明,使用适当的提示技术,我们可以在某些游戏中实现高达 78.94%的准确度,为视频游戏漏洞检测提供了积极的前景。