Nov, 2023

从图像到标题:使用卷积神经网络进行视频游戏辨识

TL;DR通过使用五种卷积神经网络(MobileNet、DenseNet、EfficientNetB0、EfficientNetB2 和 EfficientNetB3),对 22 种家用游戏主机系统(从 Atari 2600 到 PlayStation 5)的单个截图进行视频游戏识别的研究,确认了 CNN 在截图中提取图像特征的能力,实现了在没有额外特征的情况下从截图中识别游戏标题。利用 ImageNet 预训练权重,EfficientNetB3 实现了最高的平均准确性(74.51%),而 DenseNet169 在 22 个系统中的 14 个系统表现出色。使用来自另一个截图数据集的替代初始权重提高了 EfficientNetB2 和 EfficientNetB3 的准确性,后者在平均 23.7 个收敛周期降低到 20.5 个周期,并达到了最高准确性 76.36%。总体而言,通过优化架构和权重的组合,主要由 EfficientNetB3 在 19 个系统中领先,实现了 77.67% 的准确性,这些发现强调了 CNN 在通过截图进行视频游戏识别方面的有效性。