Dec, 2023

PoseViNet: 使用多视角姿态估计和视觉变换器的分心驾驶员动作识别框架

TL;DR该研究引入了一种利用多视角驾驶员行为图像检测驾驶员分心的新方法,该方法基于姿态估计和动作推理的视觉变换器框架,名为 PoseViNet。通过将姿势信息添加到变换器中,使其更加专注于关键特征,从而更好地识别关键动作。通过与现有模型在两个不同的数据集上的比较,证明了 PoseViNet 的优越性。在具有挑战性的 SynDD1 数据集上,PoseViNet 实现了 97.55%的验证准确率和 90.92%的测试准确率。