BriefGPT.xyz
Ask
alpha
关键词
semantic representation late fusion neural network
搜索结果 - 1
使用来自视觉 - 语言模型的通用表示进行驾驶员活动分类
使用视觉 - 语言模型的通用表征,在司机活动分类中利用语义表示延迟融合神经网络(SRLF-Net)的新方法,通过对多个视角的同步视频帧进行处理,对每个帧进行预训练的视觉 - 语言编码器进行编码,并融合生成类别概率预测,利用对比学习的视觉 -
→
PDF
2 months ago
Prev
Next