Jun, 2023

视觉 - 语言模型能从自然视频中识别分心驾驶员的行为

TL;DR提出了一种基于 CLIP 的驾驶员活动识别方法,该方法可以从自然驾驶图像和视频中识别驾驶员分心行为,并具有零样本迁移和面向任务的微调的特点。